近日,字節跳動旗下智能AI助手豆包升級文生圖能力,支持一鍵生成指定文本。用戶可以在生圖提示詞中加入文本要求,如“一張帶有「新年快樂」的圖”,即可生成帶有指定文字的圖片。目前該功能已經在豆包APP開啟測試,即夢也已小范圍測試。
(用豆包生成帶有文字的圖片)
對文生圖模型而言,如何在圖像中精準生成文本一直是難題,尤其是中文文字,經常出現亂碼。據介紹,相比英文字母,漢字字符結構更復雜,且字符數量要多兩個數量級。豆包大模型團隊相關負責人表示,豆包文生圖模型通過打通LLM和DIT構架,具備更好的原生中文數據學習能力,并在此基礎上強化了漢字生成能力,大幅提升了生成效果。
據觀察,已有不少用戶嘗試使用該能力制作表情包、梗圖漫畫,或輔助生成海報,并在社交媒體平臺發布。據介紹,當前該功能僅支持文生圖時添加文字,暫不支持上傳圖片生成文字。
(即夢內測用戶在社交媒體發布的圖片)
豆包負責人表示,該能力剛剛推出,仍在完善和優化中。目前絕大多數情況下豆包能夠準確生成指定文字,但仍存在少部分錯字、漏字或小字亂碼等情況。“不管文字、圖片、還是音樂生成功能,豆包都希望能夠降低創作門檻,幫助人們更好地表達和創造。”
據悉,豆包網頁及電腦版也將在近期上線該能力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.