5 月 28 日消息,微軟在 Build 2024 大會上發(fā)布了 Phi-3 家族的最新成員--Phi-3-vision,主打“視覺能力”,能夠理解圖文內(nèi)容,同時據(jù)稱可以在移動平臺上流暢高效運行。
Phi-3-vision 是一款多模態(tài)小型語言模型(SLM),主要用于本地 AI 場景,該模型參數(shù)量為 42 億,上下文長度為 128k token,能夠為常規(guī)視覺推理任務和其他任務提供支持。
那么 Phi-3-vision 有多厲害?微軟今天發(fā)布了新的論文 [PDF],表示該 SLM 和 Claude 3-haiku、Gemini 1.0 Pro 等其他模型不相上下。
微軟在論文中對比了 ScienceQA、MathVista 和 ChartQA 等模型,Phi-3-vision 的參數(shù)雖然不多,但性能非常優(yōu)秀。
據(jù)此前報道,微軟提供了 Phi-3-vision 相較于字節(jié)跳動 Llama3-Llava-Next(8B)、微軟研究院和威斯康星大學、哥倫比亞大學合作的 LlaVA-1.6(7B)、阿里巴巴通義千問 QWEN-VL-Chat 模型等競品模型的比較圖表,其中顯示 Phi-3-vision 模型在多個項目上表現(xiàn)優(yōu)異。
發(fā)布日期: 2024-06-04
發(fā)布日期: 2024-05-06
發(fā)布日期: 2025-03-18
發(fā)布日期: 2023-11-30
發(fā)布日期: 2024-07-17
發(fā)布日期: 2024-07-10
發(fā)布日期: 2024-04-28
發(fā)布日期: 2024-10-31
發(fā)布日期: 2025-03-31
發(fā)布日期: 2025-03-31
發(fā)布日期: 2025-03-31
發(fā)布日期: 2025-03-31
發(fā)布日期: 2025-03-31
尋找更多銷售、技術(shù)和解決方案的信息?
廣州綠測電子科技有限公司(簡稱:綠測科技)成立于2015年11月,是一家專注于耕耘測試與測量行業(yè)的技術(shù)開發(fā)公司。綠測科技以“工程師的測試管家”的理念向廣大客戶提供專業(yè)的管家服務。綠測科技的研發(fā)部及工廠設立于廣州番禺區(qū),隨著公司業(yè)務的發(fā)展,先后在廣西南寧、深圳、廣州南沙、香港等地設立了機構(gòu)。綠測科技經(jīng)過深耕測試與測量領(lǐng)域多年,組建了一支經(jīng)驗豐富的團隊,可為廣大客戶提供品質(zhì)過硬的產(chǎn)品及測試技術(shù)服務等支持。
技術(shù)工程師
020-22042442