為什么選php語言做網(wǎng)站手機百度網(wǎng)盤下載慢怎么解決
最近抖音剪映發(fā)布了圖文生成視頻功能,同時百家號也有這個功能,這個可以看做是一個開源的實現(xiàn),一起看看它的原理吧~
一句話提示詞 | 大模型生成文案 | 百家號生成視頻效果 | MoneyPrinterTurbo生成視頻效果 |
天空為什么是藍色的? | 天空之所以呈現(xiàn)藍色,是因為大氣中的分子和小粒子會散射太陽光中的藍色光線比其他顏色更多。這種現(xiàn)象稱為“瑞利散射”。太陽光是由不同顏色的光線組成的,這些顏色的光線混合在一起形成了白光。在地球的大氣中,較短的波長,如藍色和紫色,比較長的波長,如紅色和橙色,更容易被散射。然而,我們的眼睛對藍色光線的敏感度更高,因此我們看到的天空大部分時間都是藍色的。此外,當太陽接近地平線時,光線需要穿越更多的大氣層,這使得更多的藍色和綠色光線被散射掉,留下的主要是紅色和橙色,這就是為什么日落和日出時天空會呈現(xiàn)出紅色或橙色的原因。 | 天空為什么是藍色的? | 天空為什么是藍的MPT生成 |
一、項目說明
利用AI大模型,一鍵生成高清短視頻:只需提供一個視頻 主題 或 關鍵詞 ,就可以全自動生成視頻文案、視頻素材、視頻字幕、視頻背景音樂,然后合成一個高清的短視頻。
1.功能特性
-
完整的MVC架構,代碼結構清晰,易于維護,支持
API
和Web界面
-
支持視頻文案AI自動生成,也可以自定義文案
-
支持多種高清視頻尺寸
-
豎屏 9:16,
1080x1920
-
橫屏 16:9,
1920x1080
-
-
支持批量視頻生成,可以一次生成多個視頻,然后選擇一個最滿意的
-
支持視頻片段時長設置,方便調(diào)節(jié)素材切換頻率
-
支持中文和英文視頻文案
-
支持多種語音合成
-
支持字幕生成,可以調(diào)整
字體
、位置
、顏色
、大小
,同時支持字幕描邊
設置 -
支持背景音樂,隨機或者指定音樂文件,可設置
背景音樂音量
-
視頻素材來源高清,而且無版權
-
支持OpenAI、moonshot、Azure、gpt4free、one-api、通義千問、Google Gemini、Ollama等多種模型接入
2.后期計劃
-
GPT-SoVITS 配音支持
-
優(yōu)化語音合成,利用大模型,使其合成的聲音,更加自然,情緒更加豐富
-
增加視頻轉(zhuǎn)場效果,使其看起來更加的流暢
-
增加更多視頻素材來源,優(yōu)化視頻素材和文案的匹配度
-
增加視頻長度選項:短、中、長
-
打包成一鍵啟動包(Windows,macOS),方便使用
-
增加免費網(wǎng)絡代理,讓訪問OpenAI和素材下載不再受限
-
可以使用自己的素材
-
朗讀聲音和背景音樂,提供實時試聽
-
支持更多的語音合成服務商,比如 OpenAI TTS, Azure TTS
-
自動上傳到YouTube平臺
二.安裝部署
1.安裝
-
盡量不要使用 中文路徑,避免出現(xiàn)一些無法預料的問題
-
請確保你的 網(wǎng)絡 是正常的,VPN需要打開
全局流量
模式
① 克隆代碼
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
② 修改配置文件
-
將
config.example.toml
文件復制一份,命名為config.toml
-
按照
config.toml
文件中的說明,配置好pexels_api_keys
和llm_provider
,并根據(jù) llm_provider 對應的服務商,配置相關的 API Key
③ 配置大模型(LLM)
-
如果要使用
GPT-4.0
或GPT-3.5
,需要有OpenAI
的API Key
,如果沒有,可以將llm_provider
設置為g4f
( 一個免費使用GPT的開源庫 https://github.com/xtekky/gpt4free ,但是該免費的服務,穩(wěn)定性較差,有時候可以用,有時候用不了) -
或者可以使用到 月之暗面 申請。注冊就送 15元體驗金,可以對話1500次左右。然后設置
llm_provider="moonshot"
和moonshot_api_key
-
也可以使用 通義千問,具體請看配置文件里面的注釋說明
2.部署
① 創(chuàng)建虛擬環(huán)境
建議使用conda創(chuàng)建 python 虛擬環(huán)境
git clone https://github.com/harry0703/MoneyPrinterTurbo.gitcd MoneyPrinterTurboconda create -n MoneyPrinterTurbo python=3.10conda activate MoneyPrinterTurbopip install -r requirements.txt
② 安裝好 ImageMagick
Windows:
-
下載https://imagemagick.org/archive/binaries/ImageMagick-7.1.1-29-Q16-x64-static.exe
-
安裝下載好的 ImageMagick,注意不要修改安裝路徑
-
修改
配置文件 config.toml
中的imagemagick_path
為你的實際安裝路徑(如果安裝的時候沒有修改路徑,直接取消注釋即可)
MacOS:
brew install imagemagick
Ubuntu:
sudo apt-get install imagemagick
CentOS:
sudo yum install ImageMagick
③ 啟動Web界面
注意需要到 MoneyPrinterTurbo 項目根目錄
下執(zhí)行以下命令
Windows:
conda activate MoneyPrinterTurbowebui.bat
MacOS or Linux:
conda activate MoneyPrinterTurbosh webui.sh
啟動后,會自動打開瀏覽器
④ 啟動API服務
python main.py
啟動后,可以查看API文檔
http://127.0.0.1:8080/docs或者http://127.0.0.1:8080/redoc直接在線調(diào)試接口,快速體驗
三.源碼剖析
1.開發(fā)框架
-
UI:Streamlit ? A faster way to build and share data apps
-
OpenAPI:FastAPI
2.參數(shù)解析
{"video_subject": "string", ## 視頻主題,必選"video_script": "", ## 視頻腳本,可以為空,為空則LLM生成"video_terms": "string", ## 視頻搜索詞列表,英文,可以為空,為空則LLM生成"video_aspect": "9:16", ## 視頻寬高比,支持:"16:9""9:16""1:1""video_concat_mode": "random", ## 視頻拼接方式,支持:"random""sequential""video_clip_duration": 5, ## 視頻剪輯持續(xù)時長,默認5,小于此時長的視頻不會被下載"video_count": 1, ## 視頻生成個數(shù),默認1"video_language": "", ## 視頻語言"voice_name": "", ## 配音人名稱"voice_volume": 1, ## 配音音量,默認1"bgm_type": "random", ## 背景音樂選擇類型,