靠实用性出圈，讯飞星火果真造福当代文字工作者-kf凯发

靠实用性出圈，讯飞星火果真造福当代文字工作者

来源：太阳信息网发布时间：2023-06-06 15:18:37

前不久，娱乐资本论根据gpt-3.5、讯飞星火、文心一言、通义千问和昆仑万维天工五款大模型发布了“万字横评”，提出18个问题得出90个回答，最终以测试评分表形式进行打分。结果显示，gpt-3.5以74分位列第一，讯飞星火以63分位列第二，文心一言以54份位列第三。其测试方法非常接地气，侧重于实际文本应用场景的演练，更符合文字工作者的实际工作需求，而不是评测顺口溜或回答哲学问题。

在评测中，文本应用场景被分为了小红书带货文案、抖音直播文案、知乎问答等十余类，都是用户应用广泛、且非常熟悉的文本应用场景。如在面向小红书平台提交手机新品的带货文案创作中，讯飞星火在prompt未制定手机型号时，自己假定了一款型号，以帮助人类更好地了解手机推销所需的主要指标，不仅条例清晰、内容齐全、而且emoji具有相关性;与之对比的文心一言和天工大模型在prompt里指明小红书文案要带有emoji，但给出的答案却并没有。

因此在小红书文案三类测试中，星火累计得分高达11分，而其余国产大模型得分较低。

在虚构热点事件的新闻稿创作中，参与横评的大模型都要以资深编辑身份，写一段周杰伦召开鸟巢30场演唱会的800字演讲稿。

结果gpt-3.5等文风浮夸，而星火在不给事件细节的前提下，不仅虚构了合情合理的演唱会主题、阶梯式定价以及多种优惠政策等描述，还“脑洞大开”写了一段主办方推出“虚拟看台”创新服务的延展，与当下热门的元宇宙概念紧密相连，成为了唯一一个单项满分的大模型。而在淘宝商品详情页描述文案、广告片宣传文案、公关稿生成等场景应用中，讯飞星火在国产大模型中都排名第一。

娱乐资本论强调：“使用ai工具尽可能减少人力投入，是我们做这个横评的终极目标”。通过横评测试可知，讯飞星火生成文本完成度最高，只需少量人工修改即可使用。所以说讯飞星火能够帮助记者、编辑、文案、新媒体从业者以及设计师等创作人群利用有限线索、高效创作可用内容，实现事半功倍的效率跃迁。

与此同时从华东师范大学计算机科学与技术学院edunlp团队发布的教育领域大模型测评框架与国内大模型评测情况来看，讯飞星火大模型在k12教育领域的总体表现较为出色，在教学知识与学生发展方面的性能对比中，多项任务性能表现甚至超越了chatgpt。

过去一个月，笔者也从对讯飞星火的“浅尝辄止”变成了“爱不释手”，习惯用它辅助创意文案创作与编辑类工作开展。

6月6日凌晨，苹果发布了首款mr头显设备vision pro，这么重磅的新闻非常考验发布的时效性。为了加速创作，笔者用讯飞星火来辅助创作了一篇新闻稿，并罗列了四项要求。结果讯飞星火写的文章非常工整，涵盖了丰富的信息，简单修改就能成稿发布了，这对于抢首发流量的媒体工作者来说，大模型就成为了颠覆生产力的辅助工具。

讯飞星火自5月6日发布以来，距今刚好“满月”，无论是权威媒体横向评测还是通过笔者的亲身使用，可以确定的是，讯飞星火在辅助文案创作、创意文案生成等实用场景表现出色，绝对是文案、策划以及编辑等群体的好帮手。

标签：

上一篇：集成灶10大品牌帅丰电器“年中钜惠，工厂狂欢购”活动圆满成功！

靠实用性出圈，讯飞星火果真造福当代文字工作者-kf凯发

猜你喜欢

对于市场，加息收尾比降息开启更重要

加拿大要求剥离在加锂矿资产中矿资源等三家公司回应：影响不大

2023电信日|思特奇以科技创新为翼，携手运营商数字生态共飞腾

【天天聚看点】为促进学生全面发展今年将启动基础教育课程教学深化改革

深圳纺织服装出口快速增长前三季度民营企业出口纺织服装333.7亿元

集成灶10大品牌帅丰电器“年中钜惠，工厂狂欢购”活动圆满成功！

建设绿色未来！比亚迪参与巴西太阳能建设生产光伏组件超200万块

48小时点击排行

图片新闻

安徽人民币各项存款余额增速全国第三企业融资成本稳中有降

中信银行上饶分行因员工行为管理不到位被罚50万

多家银行近期宣布暂停智能投顾业务申购投资者该怎么办？

关于kf凯发

kf凯发的联系方式

供稿服务

广告服务