10 月 29 日消息,北京智源人工智能研究院(BAAI)推出了新的擴(kuò)散模型架構(gòu) OmniGen,這是一種用于統(tǒng)一圖像生成的多模態(tài)模型。
▲ 文本生成圖像,編輯生成圖像的部分元素,根據(jù)生成圖像的人體姿態(tài)生成重繪圖像,從另一圖像中提取所需對(duì)象與新圖像融合
官方表示,OmniGen 具有以下特點(diǎn):
統(tǒng)一性:OmniGen 天然地支持各種圖像生成任務(wù),例如文生圖、圖像編輯、主題驅(qū)動(dòng)生成和視覺條件生成等。此外,OmniGen 可以處理經(jīng)典的計(jì)算機(jī)視覺任務(wù),將其轉(zhuǎn)換為圖像生成任務(wù)。
簡(jiǎn)單性:OmniGen 的架構(gòu)高度簡(jiǎn)化。此外,與現(xiàn)有模型相比,它更加用戶友好,可以通過(guò)指令完成復(fù)雜的任務(wù),而不需要冗長(zhǎng)的處理步驟和額外的模塊 (如 ControlNet 或 IP-Adapter),從而大大簡(jiǎn)化了工作流程。
知識(shí)遷移:受益于統(tǒng)一格式的學(xué)習(xí),OmniGen 有效地跨不同任務(wù)遷移知識(shí),應(yīng)對(duì)未見過(guò)的任務(wù)和領(lǐng)域,并展示新穎的功能。我們還探討了模型的推理能力和思維鏈機(jī)制的在圖像生成領(lǐng)域的潛在應(yīng)用。
▲ 指代表達(dá)生成
發(fā)布日期: 2024-01-02
發(fā)布日期: 2024-05-13
發(fā)布日期: 2024-07-18
發(fā)布日期: 2025-02-19
發(fā)布日期: 2024-04-22
發(fā)布日期: 2025-02-18
發(fā)布日期: 2024-07-17
發(fā)布日期: 2024-04-28
發(fā)布日期: 2025-03-31
發(fā)布日期: 2025-03-31
發(fā)布日期: 2025-03-31
發(fā)布日期: 2025-03-31
發(fā)布日期: 2025-03-31
尋找更多銷售、技術(shù)和解決方案的信息?
廣州綠測(cè)電子科技有限公司(簡(jiǎn)稱:綠測(cè)科技)成立于2015年11月,是一家專注于耕耘測(cè)試與測(cè)量行業(yè)的技術(shù)開發(fā)公司。綠測(cè)科技以“工程師的測(cè)試管家”的理念向廣大客戶提供專業(yè)的管家服務(wù)。綠測(cè)科技的研發(fā)部及工廠設(shè)立于廣州番禺區(qū),隨著公司業(yè)務(wù)的發(fā)展,先后在廣西南寧、深圳、廣州南沙、香港等地設(shè)立了機(jī)構(gòu)。綠測(cè)科技經(jīng)過(guò)深耕測(cè)試與測(cè)量領(lǐng)域多年,組建了一支經(jīng)驗(yàn)豐富的團(tuán)隊(duì),可為廣大客戶提供品質(zhì)過(guò)硬的產(chǎn)品及測(cè)試技術(shù)服務(wù)等支持。
技術(shù)工程師
020-22042442