AI 이미지 생성은 단순한 단어 조합을 넘어, 학습 데이터의 관습과 편향을 설계적으로 우회하는 과정입니다.
특히 고양이 자세(Cat Pose)처럼 특정 요가 포즈 + 후면(Back View)라는 조합을 요구할 때, AI는 대부분 측면 앵글만 고집하곤 합니다. 이는 사용자가 아무리 뒷모습을 강조해도 결과가 쉽게 바뀌지 않는 이유이기도 하죠.
본 글에서는 제가 정확한 후면 45도 앵글을 목표로 실제 시도했던 프롬프트 전략과 실패 원인을 정리했습니다.
단순 성공 사례가 아닌, 무엇이 안 되었고 왜 안 되었는가를 기술적으로 공유해, 같은 목표를 가진 분들이 시행착오를 줄일 수 있도록 돕고자 합니다.
이 글은 Whisk AI 이미지 생성에서 특정 동작 + 특정 카메라 앵글 + 후면 구도를 동시에 만족시키고 싶은데 계속 다른 포즈가 출력되는 사용자에게 도움이 됩니다. 특히 고양이 자세나 테이블탑 포즈를 구현할 때 측면 결과가 반복되는 문제를 해결하고 싶은 분께 유용합니다.
1. 고양이 자세와 뒷모습의 첫 번째 충돌
처음에는 복장을 레깅스로 바꾸고, 포즈를 고양이 자세로 설정하면 ‘뒷모습’이 쉽게 나올 줄 알았다.
하지만 AI는 내가 ‘뒷모습’을 아무리 외쳐도 계속 ‘고개를 푹 숙인 옆모습’만을 생성했다. 나는 AI가 고양이 자세를 그릴 때 무조건 측면 시점으로 학습된 강력한 관습이 있다는 것을 알게 되었다.
단순한 ‘뒷모습’ 지시로는 이 학습된 관습을 우회할 수 없다는 좌절감을 느꼈다.
[테스트 시작 프롬프트]
A masterpiece, photorealistic, hyper-detailed, high-quality portrait of a beautiful young Korean woman with long dark hair, featuring a flawless face and slender, elongated figure, whose perfectly manicured fingernails and toenails are painted with a pristine white polish, wearing a hyper-defined, skin-tight, full-length black athletic leggings and a form-fitting, long-sleeved white cropped top (or sports bra) that highlights her midriff and upper body silhouette, paired with pristine white crew socks worn over the leggings; the setting is a bright, minimalist, natural light-filled yoga studio with light wood flooring and large windows, creating an atmosphere of clean fitness and health; the model is kneeling on all fours on the floor in an arched stretching pose (similar to Cow Pose or a deep variation of Tabletop Pose), with both knees and both hands firmly placed on the floor, and her hips are pushed high upwards, with the pelvis forming the highest point of the body's silhouette, creating a maximum, taut curvature in her lower back and gluteal region; her torso is stable, and her neck is aligned naturally with her torso, keeping her gaze focused on the floor, maintaining the pose's integrity; the camera captures a FULL-BODY SHOT, from an elevated view, positioned behind and slightly to the side of the model, as if looking over her shoulder and down (Over-the-Shoulder Perspective), focusing intensely on the elegant, elongated stretching lines of her entire rear profile, from the back of her head, down her spine, and across the maximum elevation of her glutes. The perspective uses a shallow depth of field to keep her back and glutes in razor-sharp focus, ensuring her entire figure is artfully composed and emphasizing the athletic tension and graceful lines of her body against the clean studio environment, rendered with hyper-realistic textures.2. 모순된 프롬프트로 Whisk의 고집 꺾기 시도
뒷모습을 강제하기 위해 나는 모순적인 프롬프트 전략을 시도했다. 고양이 자세를 취하되 고개를 들어 카메라를 응시하라는 지시를 추가한 것이다.
‘뒷모습’인데 ‘카메라 응시’라니! 이 모순을 통해 AI가 시점을 강제로 바꾸도록 유도하려 했다. 내가 시도했던 구체적인 프롬프트는 다음과 같다.
[실패 프롬프트 (고개 들기 시도)]
A masterpiece, photorealistic, hyper-detailed, high-quality portrait of a beautiful young Korean woman with long dark hair, featuring a flawless face and slender, elongated figure, whose perfectly manicured fingernails and toenails are painted with a pristine white polish, wearing a hyper-defined, skin-tight, full-length black athletic leggings and a form-fitting, long-sleeved white cropped top (or sports bra) that highlights her midriff and upper body silhouette, paired with pristine white crew socks worn over the leggings; the setting is a minimalist, plain ivory background, seamlessly blending without any discernible features or furniture, illuminated by soft, even lighting to ensure a clear focus on the model; the model is kneeling gracefully on the polished floor in an authentic Extended Puppy Pose (Uttana Shishosana), with her thighs perpendicular to the floor and her shins resting flat on the ground, and her upper body is deeply bent forward and downwards, with her forehead gently touching the floor or a yoga mat, but her head is slightly lifted to gaze directly at the camera with a calm, serene expression, while her arms are extended straight out on the floor in front of her, palms down, creating a stunning, elegant arch along her lower back and emphasizing the graceful line from her glutes to her shoulders; the camera captures a balanced, top-down high-angle full-body shot, focusing on the overall harmonious composition of her pose within the spacious room, with the lens positioned above her, looking down, ensuring her entire extended figure is visible and artfully composed within the frame, highlighting the elegant lines of her stretching body and the clean, minimalist environment, rendered with hyper-realistic textures.결과 : 이 시도는 실패했다. AI는 앵글을 바꾸기보다 고양이 자세 자체를 ‘스핑크스 자세’처럼 변형시키는 길을 택했다. 포즈가 무너지면서 뒷모습은 여전히 구현되지 않았다.
3. BACK VIEW와 둔부 강조로 강력하게 밀어붙이기
모순 전략이 실패하자, 나는 가장 직접적인 방법으로 프롬프트를 수정했다.
‘BACK VIEW’와 ‘THREE-QUARTER REAR ANGLE’을 명확히 명시하고, ‘powerful rear profile, glutes’에 초점을 맞추라고 요구했다. 이 앵글과 강조를 통해 Whisk의 앵글 고집을 꺾을 수 있을 거라고 생각했다.
[실패 프롬프트 (뒷모습 강제)]
A masterpiece, photorealistic, hyper-detailed, high-quality portrait of a beautiful young Korean woman with long dark hair, featuring a flawless face and slender, elongated figure, whose perfectly manicured fingernails and toenails are painted with a pristine white polish, wearing a hyper-defined, skin-tight, full-length black athletic leggings and a form-fitting, long-sleeved white cropped top (or sports bra) that highlights her midriff and upper body silhouette, paired with pristine white crew socks worn over the leggings; the setting is a minimalist, plain ivory background, seamlessly blending without any discernible features or furniture, illuminated by soft, even lighting to ensure a clear focus on the model; the model is kneeling gracefully on the polished floor in an authentic Extended Puppy Pose (Uttana Shishosana), with her thighs perpendicular to the floor and her shins resting flat on the ground, and her upper body is deeply bent forward and downwards, while her arms are extended straight out on the floor in front of her, palms down, creating a stunning, elegant arch along her lower back and emphasizing the graceful line from her glutes to her shoulders; her neck is aligned naturally with her torso, keeping her gaze focused on the floor, maintaining the pose's integrity; the camera captures a full-body shot from a BACK VIEW / THREE-QUARTER REAR ANGLE, focusing intensely on the powerful rear profile, glutes, and the taut lines of the leggings, with the lens positioned at a HIGH-ANGLE looking steeply down from directly behind the model, ensuring her entire extended figure is artfully composed and emphasizing the rear silhouette and the stretching lines of her body against the minimalist environment, rendered with hyper-realistic textures.결과: 강력한 프롬프트에도 불구하고 AI는 또다시 뒷모습 미구현이라는 결과를 내놓았다. 나는 고양이 자세와 ‘뒷모습’의 충돌이 프롬프트의 강도를 넘어서는 AI의 학습된 고집 때문임을 확신하게 되었다.
4. 로우 앵글 뒷모습은 Whisk의 레드 라인
마지막으로, ‘엉덩이 들림’ 효과를 극대화하기 위해 ‘테이블탑 포즈’로 바꾸고 ‘로우 앵글 뒷모습 45도’를 시도했다. 나는 이 조합이 필터링될 위험이 크다는 것을 알고 있었지만, 마지막 시도였다.
[실패 프롬프트 : 앵글 특징]
EXTREME LOW-ANGLE SHOT (from the floor level), positioned behind and 45-degrees to the side of the model (Rear-Quarter View)결론: 예상대로 AI는 이 시도를 안전 필터에 의해 거부하며 이미지 생성을 중단했다. 나는 고양이 자세 같은 ‘둔부 강조 바닥 자세’와 ‘로우 앵글 후면 시점’의 조합이 AI가 절대 허용하지 않는 레드 라인임을 이 실패를 통해 명확히 경험했다.
마치며
결과적으로 2번째 시도한 프롬프트가 가장 고양이 자세에 가까웠다.
아쉽게도 완전한 뒷모습을 출력할 수는 없었지만 프롬프트를 기반으로 카메라 앵글, 모델 포즈를 조금씩 수정하면 이 글을 보는 방문자가 원하는 이미지를 얻을 수 있을 것이다.


