DeepSeek 正式开源结合电脑视觉的 Janus-Pro-7B 多模态 AI 模型。
除了以同名大型人工智慧模型引起市场关注,DeepSeek稍早更透过GitHub公布其结合电脑视觉的多模态人工智慧模型「Janus-Pro-7B」。
跟其他业者提出多模态模型一样,「Janus-Pro-7B」也能借由电脑视觉方式分析图像内容,并且配合文字理解能力给予更深入的推论解答。
依照说明,「Janus-Pro-7B」可针对图像内容进行分析描述,识别地理位置、辨识图像中的文字内容,或是回答图像中的情境。另一方面,借由「Janus-Pro-7B」生成图像也能有更高品质、更真实细节,甚至能配合理解使用者输入描述产生更合适图像。
跟先前已经以开源形式提供使用的DeepSeek R1模型一样,目前「Janus-Pro-7B」也已经在GitHub以开源形式提供使用。
而微软稍早也宣布可在符合「Copilot+ PC」设计的装置上执行蒸馏处理后的「DeepSeek-R1-Distill-Qwen-1.5B」模型,预期先开放搭载Qualcomm Snapdragon X系列处理器的笔电使用,之后也会让采用Intel Core Ultra 200V系列笔电处理器,以及AMD Ryzen AI 9系列处理器的笔电使用。
除了允许「Copilot+ PC」设计装置使用「DeepSeek-R1-Distill-Qwen-1.5B」模型,未来也会持续提供70亿组参数版本与140亿组参数版本,同时也会在Azure AI Foundry允许更多开发者、企业界由微软云端服务平台使用。
发表评论 取消回复