2026년 6월 8일 월요일

AI로 세로형 숏폼 100개 자동 생성하는 파이프라인 구축법 — 틱톡·릴스·쇼츠 동시 운영 2026

 숏폼의 역설이 있다. 짧을수록 더 많이 올려야 한다.

유튜브 롱폼은 주 1편으로도 채널이 운영되지만, 틱톡과 인스타 릴스는 하루 1~3편을 꾸준히 올려야 알고리즘이 살아있다. 30초짜리 영상 하나를 만드는 데 기획·촬영·편집·자막·업로드까지 평균 90분이 걸린다면, 월 100편을 만들기 위해서는 150시간이 필요하다. 수면 시간 빼면 거의 모든 깨어있는 시간을 숏폼에 쏟아야 한다는 계산이다.

2026년, 이 구조를 완전히 뒤집는 파이프라인이 현실적으로 가능해졌다.

아이디어 하나를 입력하면 AI가 대본을 쓰고, 영상을 만들고, 자막을 붙이고, 틱톡·릴스·쇼츠 세 플랫폼에 동시 예약 업로드하는 자동화 시스템이다. 이 파이프라인이 완성되면 월 100편의 숏폼을 사람이 직접 투자하는 시간 기준으로 10시간 이내에 처리할 수 있다. 이 글에서는 그 시스템을 처음부터 끝까지 구축하는 방법을 5단계로 완전히 공개한다.


✅ 이 파이프라인이 가능해진 3가지 기술적 배경

1년 전만 해도 이 수준의 자동화는 개발자 팀이 필요한 작업이었다. 2026년에 비개발자도 구축 가능한 이유는 세 가지 기술적 변화 덕분이다.

첫째, AI 영상 생성 API의 상업화다. HeyGen, Kling, Runway 같은 AI 영상 도구들이 API를 공개하면서 자동화 도구(Make, n8n)와 직접 연결이 가능해졌다. 이전에는 사람이 직접 플랫폼에 접속해 영상을 생성해야 했지만, 이제는 코드 없이도 트리거 하나로 영상 생성이 시작된다.

둘째, CapCut의 서드파티 API 생태계 확장이다. CapCut은 2025년 말 자막 자동 생성, 배경음악 매칭, 텍스트 오버레이 기능의 API를 부분 공개했다. 이로써 영상 편집의 핵심 반복 작업이 완전히 자동화 가능해졌다.

셋째, 멀티플랫폼 예약 업로드 도구의 성숙이다. Buffer, Later, Publer 등이 틱톡·인스타그램·유튜브 동시 예약 업로드를 안정적으로 지원하며, 이 도구들은 Make, n8n과 API로 연동된다. 한 번의 자동화 흐름으로 세 플랫폼에 동시 배포하는 것이 현실적으로 가능해진 것이다.


🏗️ 5단계 파이프라인 완전 구축 가이드

파이프라인 전체를 한꺼번에 만들려 하면 압도당한다. 단계별로 독립적으로 구축하고, 작동을 확인한 후 연결하는 방식으로 접근한다.


1단계: 소재 수집 자동화 — 아이디어 고갈 없는 시스템

모든 숏폼 파이프라인의 시작은 콘텐츠 소재다. 매일 "오늘 뭘 올리지"를 고민하는 대신, 소재가 자동으로 쌓이는 수집 시스템을 먼저 만든다.

노션 데이터베이스를 숏폼 소재 허브로 설정한다. 다음 세 가지 자동 수집 루트를 Make로 연결한다.

구글 트렌드 RSS는 매일 오전 6시에 국내 급상승 키워드 10개를 수집해 노션에 자동 저장한다. 틱톡 트렌딩 해시태그 수집은 Apify의 틱톡 스크래퍼를 활용한다. 월 $49 수준의 저렴한 API로 현재 한국 틱톡에서 바이럴 중인 해시태그와 오디오 트렌드를 하루 2회 자동 수집할 수 있다. 그리고 자신의 채널 인사이트 자동 수집은 각 플랫폼 API를 통해 이전 7일간 가장 높은 조회수를 기록한 콘텐츠 유형을 분석해 소재 방향 힌트를 제공한다.

이 세 소스가 연결되면 매일 아침 노션에 20~30개의 소재 후보가 자동으로 채워진다. 운영자가 할 일은 그 중 유망한 것에 체크 표시를 하는 것뿐이다. 이 체크가 2단계 파이프라인의 트리거가 된다.

소재 데이터베이스의 필드 구성은 다음과 같이 설정한다.

노션 숏폼 소재 DB 필드 구성
─────────────────────────
제목 (text)
소재 유형 (select): 트렌드/교육/스토리/제품
플랫폼 타깃 (multi-select): 틱톡/릴스/쇼츠
파이프라인 상태 (select): 대기/대본생성중/영상생성중/완료
승인 여부 (checkbox): 체크 시 자동화 트리거
예약 업로드 시간 (date)
생성된 영상 URL (url)
─────────────────────────

2단계: AI 대본 자동 생성 — Claude API 연동

노션에서 "승인" 체크박스가 활성화되면 Make가 자동으로 해당 소재 정보를 Claude API로 전달해 대본을 생성하는 흐름을 구성한다.

숏폼 대본은 일반 영상 대본과 구조가 완전히 다르다. 알고리즘이 측정하는 완시청률을 높이려면 첫 3초에 시청자를 붙잡는 훅이 핵심이다. Claude API에 전달하는 시스템 프롬프트에 이 구조를 명확히 지정한다.

[숏폼 대본 생성 시스템 프롬프트]

당신은 숏폼 콘텐츠 전문 스크립트 작가입니다.
다음 구조로 30초 분량(약 150단어) 대본을 작성하세요.

[필수 구조]
① 훅 (0~3초, 1문장): 
   시청자가 즉시 멈추게 만드는 충격적 사실,
   반직관적 주장, 또는 강한 질문
② 핵심 내용 (3~25초, 3~4문장):
   약속한 내용을 빠르고 명확하게 전달
   - 숫자와 구체적 예시 반드시 포함
   - 문장당 최대 15자 이내 (자막 가독성)
③ CTA (25~30초, 1문장):
   팔로우, 저장, 댓글 유도 중 1개만

[플랫폼별 톤]
- 틱톡: 반말체, 밈 문화 반영, 에너지 높음
- 릴스: 약간 정제된 구어체, 감성적 마무리
- 쇼츠: 정보 압축, 속도감 있는 전달

[출력 형식]
JSON으로 반환:
{
  "tiktok_script": "...",
  "reels_script": "...", 
  "shorts_script": "...",
  "hook_summary": "훅 한 줄 요약",
  "recommended_audio_mood": "업템포/감성/차분"
}

이 프롬프트로 소재 하나당 세 플랫폼용 대본이 동시에 생성된다. Make가 JSON 응답을 파싱해 노션 DB의 해당 항목에 자동 저장하고, 파이프라인 상태를 "대본생성중"에서 "영상생성중"으로 자동 업데이트한다.

대본 생성에 걸리는 시간은 평균 8~12초다. 승인된 소재 10개의 대본이 2분 안에 모두 완성된다.


3단계: 영상 자동 생성 — 두 가지 루트 선택

대본이 완성되면 실제 영상을 생성하는 단계다. 채널 유형과 예산에 따라 두 가지 루트 중 하나를 선택하거나 병용한다.

루트 A는 AI 아바타 영상으로, 채널에 고정된 진행자 캐릭터가 등장하는 형식이다. HeyGen API를 Make와 연동해 구성한다. 대본 텍스트와 아바타 ID를 API로 전달하면 해당 아바타가 대본을 말하는 영상이 자동 생성된다. 채널의 일관성을 유지하면서 얼굴 노출 없이 운영 가능한 방식이다. HeyGen API 요금은 영상 분당 약 $0.30~0.50 수준이며, 30초 숏폼 기준 장당 약 $0.15~0.25다. 월 100편 기준 약 $15~25의 영상 생성 비용이 발생한다.

루트 B는 B-roll 합성 영상으로, 스톡 영상이나 AI 생성 이미지를 배경에 깔고 텍스트 자막과 음성 나레이션을 얹는 형식이다. "사실 기반 정보 채널", "풍경·여행 채널", "AI 이미지 쇼케이스 채널" 같은 유형에 적합하다. Pexels API로 주제에 맞는 스톡 영상을 자동 수집하고, ElevenLabs API로 나레이션 음성을 생성하며, Flux API로 주제별 이미지를 생성해 조합한다. 아바타 없이 순수 AI 생성 콘텐츠로 채널을 운영할 수 있어 비용이 더 낮다.

Make에서 이 단계의 자동화 흐름은 다음과 같이 구성한다. 노션 상태가 "영상생성중"으로 변경되면 Make가 해당 대본을 읽어 선택된 루트(A 또는 B)에 따라 HeyGen API 또는 ElevenLabs + Pexels API에 요청을 보낸다. 영상 생성이 완료되면 결과 URL이 노션에 자동 저장되고 상태가 "편집중"으로 업데이트된다.


4단계: 자막·BGM 자동 편집

원본 영상이 생성됐다고 해서 바로 업로드하면 안 된다. 숏폼에서 자막은 필수 요소다. 시청자의 85% 이상이 음소거 상태로 영상을 시청하기 때문에 자막 없는 영상은 도달률이 현저히 낮다.

CapCut의 자동 자막 API를 Make와 연동하면 영상 URL을 입력받아 자동 자막이 적용된 편집 영상을 반환한다. 2026년 현재 한국어 자막 정확도는 95% 이상이므로 수동 교정 시간이 거의 없다. 자막 스타일은 채널의 브랜드 컬러에 맞게 미리 템플릿을 설정해두면 매번 동일한 스타일이 자동 적용된다.

BGM은 Suno API를 활용한다. 2단계에서 생성한 대본 JSON에 포함된 recommended_audio_mood 값을 Suno API에 전달하면 해당 분위기의 BGM을 30초 길이로 자동 생성한다. AI 생성 BGM은 저작권 걱정 없이 모든 플랫폼에서 상업적으로 사용 가능하다. 채널 고유의 BGM 라이브러리를 쌓아가면 시간이 갈수록 브랜드 인지도가 높아지는 효과도 있다.

이 단계까지 완료되면 자막이 입혀지고 BGM이 깔린 완성된 숏폼 영상이 자동으로 준비된다. 사람이 한 번도 편집 도구를 열지 않은 상태에서 업로드 직전 단계까지 진행된 것이다.

최종 품질 확인 단계를 자동화 흐름 안에 포함하는 것을 권장한다. 완성된 영상 URL을 슬랙 채널로 자동 전송해 운영자가 30초 안에 확인하고 승인 버튼을 누르면 배포가 시작되는 구조가 이상적이다. 100% 자동화보다는 최종 확인 단계를 인간이 갖는 것이 콘텐츠 품질 사고를 예방하는 안전장치가 된다.


5단계: 멀티플랫폼 자동 배포

최종 승인된 영상은 Buffer 또는 Publer API를 통해 세 플랫폼에 동시 예약 업로드된다. 각 플랫폼의 최적 업로드 시간과 플랫폼별 캡션, 해시태그는 Make가 자동으로 설정한다.

플랫폼별 설정 자동화 내용을 구체적으로 살펴보면 다음과 같다.

틱톡 설정에서는 트렌딩 사운드 ID를 자동 매칭하고 캡션을 틱톡 문화에 맞는 구어체로 자동 생성하며 해시태그를 틱톡 트렌딩 기준으로 7개 자동 선정한다. 업로드 시간은 한국 기준 오후 7~9시 사이로 자동 설정된다.

인스타그램 릴스 설정에서는 캡션을 약간 정제된 버전으로 자동 변환하고 커버 이미지를 영상 첫 프레임에서 자동 추출하며 위치 태그를 선택적으로 추가한다.

유튜브 쇼츠 설정에서는 SEO 최적화된 제목을 대본의 훅 문장 기반으로 자동 생성하고 설명란에 타임스탬프와 관련 링크를 자동 삽입하며 카테고리와 태그를 콘텐츠 주제 기반으로 자동 분류한다.

이 배포 자동화가 완성되면 영상 1편이 세 플랫폼에 동시에 최적화된 형태로 배포되는 전체 흐름이 완성된다.


⏱️ 실제 처리 시간 계산

이 파이프라인이 완성됐을 때 숏폼 100편을 만드는 데 실제로 어느 정도의 시간이 걸리는지 계산해보면 다음과 같다.

소재 확인 및 승인에 사람이 직접 개입하는 시간으로 100편 기준 약 2시간이 필요하다. 대본 생성은 편당 10초로 자동 처리되어 100편에 약 17분이 소요된다. 영상 생성은 편당 3~5분으로 자동 처리되어 100편에 약 5~8시간이 걸리지만 사람이 기다릴 필요가 없다. 자막 및 편집은 편당 2분으로 자동 처리되어 100편에 약 3시간이 소요되나 역시 자동이다. 최종 확인 및 승인에는 편당 30초로 100편 기준 약 50분이 필요하다. 예약 업로드는 자동으로 처리된다.

결론적으로 사람이 실제로 투자해야 하는 시간은 약 3시간이며, 시스템이 돌아가는 총 처리 시간은 약 8~12시간이다. 잠자는 동안 파이프라인을 돌려두면 아침에 100편이 준비되어 있는 구조가 실현된다.


💰 파이프라인 구축 비용 완전 분석

월 100편 기준 예상 비용을 도구별로 정리하면 다음과 같다.

도구용도월 비용
Make Pro자동화 오케스트레이션$16
Claude API대본 생성 (100편)약 $3~5
HeyGen CreatorAI 아바타 영상$29
ElevenLabs Starter음성 나레이션$5
CapCut for Business자막·편집 API$19
Buffer Essentials멀티플랫폼 스케줄링$15
Suno ProBGM 자동 생성$8
Pexels API스톡 영상 수집무료
합계약 $95~100/월

월 10만원 수준으로 월 100편 세 플랫폼 동시 운영이 가능한 시스템이 유지된다. 기존 방식으로 외주 영상 편집자를 고용하면 편당 최소 3만원으로 100편에 300만원이 필요한 것과 비교하면 압도적인 비용 효율이다.


🛠️ 4주 구축 로드맵

전체를 한 번에 만들지 말고 단계별로 작동하는 파이프라인을 주차별로 확장한다.

1주차에는 노션 소재 DB를 설정하고 Make로 소재 자동 수집 흐름 하나만 구축한다. 매일 아침 구글 트렌드 키워드가 노션에 자동 저장되는 것만 완성해도 1주차의 목표는 달성이다.

2주차에는 Claude API 연동으로 대본 자동 생성을 추가한다. 노션에서 체크박스를 활성화하면 3분 안에 세 플랫폼용 대본이 생성되는 흐름을 완성한다.

3주차에는 HeyGen 또는 ElevenLabs API를 연동해 영상 자동 생성을 추가하고, CapCut 자막 자동화를 연결한다. 이 시점부터 소재 승인 → 완성 영상 생성까지의 전체 흐름이 자동화된다.

4주차에는 Buffer API를 연동해 멀티플랫폼 자동 배포를 완성하고, 슬랙 최종 확인 알림을 추가한다. 이로써 전체 파이프라인이 완성된다.


⚠️ 대량 자동화 시 반드시 지켜야 할 원칙

자동화의 함정은 속도에 취해 품질을 잃는 것이다. 다음 세 가지 원칙을 지켜야 채널이 지속 가능하다.

훅의 품질은 사람이 검토한다. AI가 생성한 훅 문장은 항상 운영자가 확인해야 한다. 첫 3초의 훅 품질이 전체 완시청률을 결정하는데, AI는 때로 너무 자극적이거나 오해를 살 수 있는 표현을 생성한다. 배포 전 훅만이라도 사람이 읽어보는 습관이 채널 신뢰도를 보호한다.

플랫폼 정책 변화를 주기적으로 점검한다. 틱톡, 인스타그램, 유튜브는 AI 생성 콘텐츠에 대한 정책을 수시로 업데이트한다. 2026년 현재 세 플랫폼 모두 AI 생성 콘텐츠임을 공개하도록 권고하고 있다. 설명란이나 영상 내에 간단한 공개 문구를 자동으로 포함하는 것을 파이프라인에 기본으로 설정한다.

양보다 질로 전환하는 시점을 안다. 파이프라인이 안정화되고 채널이 성장하면 월 100편 생산보다 월 30편을 더 정교하게 만드는 것이 더 나은 성과를 낼 수 있다. 자동화 시스템은 양산 도구가 아니라 시간을 절약해 품질에 집중하게 해주는 도구임을 항상 기억한다.

숏폼 자동화의 진짜 가치는 100편을 올리는 것이 아니라, 올리지 않으면 죽는 플랫폼에서 지속적으로 살아남을 수 있는 시스템을 갖추는 것이다.

댓글 없음:

댓글 쓰기