ZERO COST · FULLY LOCAL

二哥智创

AI驱动的商品内容创作平台
一张图片 → 图文种草 / 短视频，一键出片

🎬 开始创作了解流程 →

¥0

单条视频成本

30s

平均生成耗时

100%

本地化运行

步骤全自动

// CORE FEATURES

核心能力

从商品图片到成品视频，AI全自动完成。零设计门槛，零API费用。

🧠

AI商品分析

本地大模型自动识别商品特征，提取核心卖点，生成专业级口播文案。支持多平台风格适配。

🎬

智能运镜

Ken Burns专业运镜效果 — 缓慢推拉、平滑平移，让静态商品图产生电影级动态质感。

🎙️

AI配音

Edge-TTS多音色自然语音 + GPT-SoVITS本地声音克隆，零成本获得专业级配音效果。

⚡

零成本全本地

Ollama LLM + FFmpeg + Edge-TTS，所有计算在本地完成。零API费用，数据不出本机。

📐

多平台适配

一键适配抖音、快手、小红书、视频号等平台规格，自动调整比例、尺寸和风格。

🔒

隐私安全

全链路本地化处理，商品图片、文案数据不出本机。完全自主可控，梅州造。

// PIPELINE

六步全自动流水线

一张图片进去，一条视频出来。中间所有环节，AI替你完成。

STEP 01

📸

图片输入

上传商品图片

STEP 02

🔍

AI分析

识别商品特征

STEP 03

🎨

图片处理

抠图 + 平台适配

STEP 04

✍️

文案生成

AI撰写口播脚本

STEP 05

🔊

TTS配音

语音合成 + 拼接

STEP 06

🎥

视频合成

运镜 + 字幕 + 出片

// TECH STACK

技术架构

全开源技术栈，每个环节零成本、可替换、可定制。

🤖

Ollama LLM

本地部署大语言模型，负责商品分析和文案生成。支持 qwen2.5 等主流模型。

qwen2.5:14b

🎞️

FFmpeg 8.1

专业级视频处理引擎，Ken Burns运镜、转场特效、字幕叠加、音视频合成。

zoompan + xfade

🗣️

Edge-TTS

微软免费TTS引擎，多种自然音色可选，支持中文语音合成。

zh-CN-XiaoxiaoNeural

🎭

GPT-SoVITS

本地声音克隆引擎（可选），用少量样本克隆专属音色，实现品牌声音一致性。

voice clone

✂️

Rembg

AI智能抠图引擎，自动去除商品背景，生成透明底图用于视频合成。

U2Net

🐍

Python Pipeline

模块化流水线架构，6步流程可独立运行、自由组合，易于扩展。

modular