您的当前位置:首页 > 证劵 > 大模型让让,小模型登场丨科创要闻 正文
时间:2025-05-07 23:45:59 来源:网络整理 编辑:证劵
4月23日,微软推出小语言模型SLM)Phi-3系列,有Phi-3-mini、Phi-3-small、Phi-3-medium三个版本,在评估语言、编程、数学能力等的基准测试中,Phi-3系列模型表现
4 月 23 日,大模登场微软推出小语言模型(SLM)Phi-3系列,型让有Phi-3-mini、模型Phi-3-small、丨科Phi-3-medium三个版本,创闻在评估语言、大模登场编程、型让数学能力等的模型基准测试中,Phi-3系列模型表现优于同等规模甚至更大规模模型(如GPT-3,丨科5)。微软称其是创闻目前同类中最强大且最具成本效益的小型语言模型。
Phi-3模型的大模登场“小体积”,让手机上运行高能力的型让语言模型成为可能。如Phi-3-mini只占用手机18GB内存,模型如在iPhone 14上部署,丨科苹果的创闻A16仿生芯片在设备上脱机运行,可以实现每秒超过12个token。
自2022年12月ChatGPT爆火之后,科技公司们一头扎进了大型模型的竞争,2023年接连刷新模型参数,2024年开始“内卷”长文本。大家似乎默认数据越多、参数越大、算力越强,模型的能力越强。
但是,高昂的运行成本、具体场景模型调试难度等问题,让大模型商业化的路径慢下来。此时小模型的优势就体现出来了。
小模型,目前某些领域也能接近大模型的性能。特别是在各手机和PC厂商正在力推的AIPC、AI手机上,对设备计算能力、运行能力、储存能力要求较低,能在地化运行的小模型,的确是不错的选择。
其实早在2023年6月份,微软就发布了第一代Phi模型,Phi-3系列已经是其第四代产品。近期,苹果公司也凑了小模型的热闹。
2024年4月24日,在大模型上没有什么动静的苹果公司,发布开源小语言模型OpenELM,包括
自曝在马尔代夫遭侵犯,女生被诊极度抑郁,游客回忆涉事管家2025-05-07 23:43
市区水电气暖春节24小时值班2025-05-07 22:59
日照市档案工作积极服务民生2025-05-07 22:58
市民可拨打110举报酒驾2025-05-07 22:57
国家卫健委:整体疫情已进入低流行水平2025-05-07 22:10
市科协助推蓝色经济发展2025-05-07 21:59
日照市防指通报旱情及抗旱工作情况2025-05-07 21:48
市政协提案办理全面实现网上操作2025-05-07 21:35
在位70年,96岁英女王谢幕2025-05-07 21:27
日照三部门联合清查“黑中介”2025-05-07 21:05
金融机构合规度高低 “牧羊犬”一目了然2025-05-07 23:38
实用型人才招聘会近期举行2025-05-07 23:10
日照市组织工作会议召开2025-05-07 23:08
刘西良督导检查抗旱工作2025-05-07 23:02
国家开发银行原副行长周清玉落马2025-05-07 22:34
市政协对委员履职情况进行年度考核2025-05-07 22:16
日照市区4050座检查井节日清淤2025-05-07 21:53
日照市外侨办侨务惠民见成效2025-05-07 21:48
网课爆破的旁观者之恶丨记者手记2025-05-07 21:19
日照种粮补贴工作开始 每亩增加15.3元2025-05-07 21:07