从商品图片到成品视频,AI全自动完成。零设计门槛,零API费用。
本地大模型自动识别商品特征,提取核心卖点,生成专业级口播文案。支持多平台风格适配。
Ken Burns专业运镜效果 — 缓慢推拉、平滑平移,让静态商品图产生电影级动态质感。
Edge-TTS多音色自然语音 + GPT-SoVITS本地声音克隆,零成本获得专业级配音效果。
Ollama LLM + FFmpeg + Edge-TTS,所有计算在本地完成。零API费用,数据不出本机。
一键适配抖音、快手、小红书、视频号等平台规格,自动调整比例、尺寸和风格。
全链路本地化处理,商品图片、文案数据不出本机。完全自主可控,梅州造。
一张图片进去,一条视频出来。中间所有环节,AI替你完成。
全开源技术栈,每个环节零成本、可替换、可定制。
本地部署大语言模型,负责商品分析和文案生成。支持 qwen2.5 等主流模型。
qwen2.5:14b专业级视频处理引擎,Ken Burns运镜、转场特效、字幕叠加、音视频合成。
zoompan + xfade微软免费TTS引擎,多种自然音色可选,支持中文语音合成。
zh-CN-XiaoxiaoNeural本地声音克隆引擎(可选),用少量样本克隆专属音色,实现品牌声音一致性。
voice cloneAI智能抠图引擎,自动去除商品背景,生成透明底图用于视频合成。
U2Net模块化流水线架构,6步流程可独立运行、自由组合,易于扩展。
modular梅州人的AI,全产品线自主可控。