🎬 MoneyPrinterTurbo:输入一个关键词,AI 自动给你剪出一条高清视频
你是不是也有这种经历:想做短视频,但光是找素材、配音、加字幕这三步,就能耗掉一整个下午。更别提还要考虑画面节奏、背景音乐、字幕样式……很多人还没开始就放弃了。
今天要聊的 MoneyPrinterTurbo,就是专门解决这个痛点的。你只需要给一个主题或关键词,剩下的文案、画面、配音、字幕、BGM,它全自动搞定,最终直接输出一条 1080P 高清视频。
项目到底有多火?
先看数据。这个项目在 GitHub 上已经拿到了 超过 26k 星标,Issues 和 Forks 数量也很活跃,说明社区维护得不错。它采用 MVC 架构,同时提供 Web 界面 和 API 接口,既能上手即用,也方便二次开发。
支持竖屏 9:16(1080x1920)和横屏 16:9(1920x1080),而且可以 批量生成,一次跑多个视频,挑最满意的那条。
核心功能拆解
1. 文案生成:AI 写稿 + 自定义双模式
你可以让项目内置的大模型自动生成视频文案,也可以自己写好文案直接贴进去。大模型这边支持的可太多了:
- OpenAI、Moonshot、Azure、通义千问、Google Gemini、Ollama、DeepSeek、文心一言、MiniMax、Pollinations、ModelScope……
- 国内用户推荐 DeepSeek 或 Moonshot,不需要 VPN,注册就给额度,基本够用。
2. 视频素材:高清无版权,也支持本地素材
视频素材默认从 Pexels 等免费图库抓取,高清且无版权风险。如果你有自己的素材库,也可以指定本地路径,完全由你控制。
3. 语音合成:多种声音可选,支持实时试听
项目内置了 Edge TTS 和 Azure TTS 两套引擎。Edge 速度快,Azure 声音更真实。你可以在 Web 界面里直接试听每种声音的效果,挑中再生成。
4. 字幕生成:Edge 快,Whisper 准
字幕有两种方式:
- edge:生成速度快,对电脑没要求,但质量可能不稳定
- whisper:需要下载一个约 3GB 的模型文件,生成慢一点,但字幕质量更可靠
在 config.toml 里改 subtitle_provider 就能切换。如果不需要字幕,直接留空。
5. 背景音乐:随机或指定,音量可调
BGM 可以随机选,也可以指定你喜欢的音乐文件,音量大小也能单独设置。
实操步骤:从零跑通一个视频
第一步:拉代码 + 装环境
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
uv python install 3.11
uv sync --frozen
如果你习惯用 pip,也可以:
python3.11 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
第二步:安装 ImageMagick(字幕生成必需)
- Windows:下载 ImageMagick 的静态版(比如 ImageMagick-7.1.1-32-Q16-x64-static.exe),安装后修改
config.toml里的imagemagick_path - Mac:
brew install imagemagick - Ubuntu:
sudo apt-get install imagemagick - CentOS:
sudo yum install ImageMagick
第三步:配置 API Key
复制 config.example.toml 为 config.toml,填好 pexels_api_keys 和 llm_provider 对应的 API Key。
第四步:启动 Web 界面
uv run streamlit run ./webui/Main.py --browser.gatherUsageStats=False
或者直接双击 webui.bat(Windows)/ 执行 sh webui.sh(Mac/Linux)。
浏览器打开后,输入主题,点一下生成,等它跑完就能下载视频了。
第五步:启动 API 服务(可选)
uv run python main.py
启动后访问 http://127.0.0.1:8080/docs 就能在线调试接口。
避坑指南
- 路径不要有中文和空格,否则 ImageMagick 和某些依赖会报错
- 网络要稳定,如果用了 VPN,建议开全局模式
- 字幕用 whisper 时,首次运行会下载约 3GB 模型文件,耐心等
- Windows 用户优先用一键启动包,解压后先执行
update.bat更新到最新代码 - GPU 不是必需,但如果要批量生成或用 whisper,有独立显卡会快很多
要点总结
- 输入一个关键词,全自动生成文案 + 素材 + 配音 + 字幕 + BGM,输出 1080P 视频
- 支持竖屏和横屏,支持批量生成
- 大模型、语音合成、字幕引擎都可自由切换
- 提供 Web 界面和 API,适合个人和团队使用
- 部署门槛低,Windows 有一键包,Mac/Linux 用 uv 几分钟搞定
如果你还在手动剪视频,真的可以试试把这个流程交给 AI。省下来的时间,拿来想下一个选题不是更好吗?