(资料图片)
500道题目、对标接受过高等教育的人类水平、更强调对产业和生活的实际价值,严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。
《报告》认为,具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
面对国产大模型“涌现”,讯飞星火认知大模型从立项到发布,再到迭代升级,每个节点都紧锣密鼓:5月6日发布讯飞星火认知大模型及其在教育、办公、汽车、数字员工等领域的应用落地;6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;即将到来的8月15日会在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。
在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。
在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。
《报告》认为,与2023年6月相比,当前中国大模型产品进步显著。但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。
关键词:
相关文章
-
新华社研究院AI大模型体验报告出炉:讯飞星火“智商”居首位
-
中铁五局六公司校招薪资待遇
-
速看!汛期安全提示→
-
张北—胜利特高压工程内蒙古段进入全面建设阶段
-
购进货物的会计分录怎么写 购进货物的会计分录
-
国际观察:美国对华投资限制令再次暴露“脱钩断链”图谋
-
约“惠”印江,感受梵净西线之美
-
康鹏科技(688602):该股换手率大于8%(08-16)
-
报告:2022年证券行业维持高质量发展,经营业绩短期承压
-
“不怕你赚钱,就怕你不玩”,医生炒股被骗450多万!浙江警方破
-
华信科技2023年上半年净利150.09万 同比减少67.01%
-
王大陆发长文感恩《孤注一掷》剧组 电影票房已破19亿:预计最终
-
《黑神话:悟空》玩家直喷:不是《战神》
-
兔年9月:生肖猪,鼠小有提升,生肖牛切勿盲信“第六感”!
-
债券停牌什么意思?债券停牌利好还是利空?
-
中国正能量:致敬自然守护者,点亮绿色未来
-
小区停车场噪音扰民 西安高新区:要求物业加强巡查
-
2023EMO ANCA将上演多项新技术的世界首秀
-
全国铁路暑运累计发送旅客突破6亿人次
-
财政部发布调整海南自由贸易港交通工具及游艇“零关税” 政策
热点图集
-
1广汉市汉州街道召开工贸企业重大事故隐患排查整治2023专项行动推进会
-
2广汉市住建局:免费发放灭火器 完善公房小区消防安全设施
-
3广汉市住建局测绘中心开展自来水管网测绘
-
4广汉市人大常委会开展省级文明城市创建实地督导
-
5广汉工业集中发展区召开2023年度高新技术企业申报暨政策培训会
-
6前7月全国住宅新开工面积下降25%,“保交付”下住宅竣工面积增长20.8%
-
7福特加码本土化:长安福特拟与长安汽车设立新能源合营公司
-
8中江县审计局坚持有力有效做好审计监督“上半篇文章”
-
9今年首趟成都至新疆“熊猫专列”开行 游客一票到底尽享一线多游
-
10保障老百姓住房安全!成都开展既有建筑装修改造违法违规行为专项检查