返回首页  设为首页  加入收藏  今天是:
网站首页国内新闻国际新闻时政新闻军事新闻时事新闻科技新闻房产新闻教育新闻旅游新闻
相关文章
 自媒体人必备:文心一言、Ki…
 2021年十大科技事件
 imtoken官网正版app(钱包里的…
 一文看懂2021年全球科技大事…
 房地产最新政策
 房产新政解读与国内外要闻深…
 房产新政解读:迈向高品质住…
 “ 四轮驱动 ”鄂王故里文化…
 别让无良导游抹黑文旅市场
 年终盘点:2023年国内十大文…
 厄尔尼诺威力依旧:菲律宾现…
 官网:深圳合正檀悦府官方网…
 部分自媒体误读入学政策 北京…
 国内外时政热点素材2024年4月…
 日元暴跌 有日本游客赴美时扛…
 2024时政热点:国内外时事政…
 人形机器人元年开启!波士顿…
 美股科技巨头 将迎“大考”
 英伟达市值单日蒸发15万亿回…
 星河星悦云邸价格走势资讯、…
 王健林傍上的大款能救命但不…
 美国反重力突破?不用燃料抵…
 这国总统宣布:将与以色列断…
 “亲密伙伴”哥伦比亚缘何与…
 泸州市蓝田中学校举行第一届…
 预告2024:为您精心挑选的必…
 专门为中小学生打造的英文报…
 2024南昌最新一周演出活动安…
 广西发明展:盘点智慧达人 小…
 余峻丞:用科创点亮梦想的发…
 高华科技获得发明专利授权:…
 津南融创云潮府最新情况一览…
 天津楼市结束天津和平区房价…
 天津【金地风华919】金地风华…
 五一去哪玩?温州这处人文古…
 科技赋能:“一机在手”开启…
 国内旅游景点大全
 山东探索睡眠保障作业“熔断…
 中新网河南|河南荥阳千余小…
 乡镇小学铸牢中华民族共同体…
 时政微观察丨习主席今年首次…
 长三角铁路2024年“五一”假…
 国家市场监督管理总局:严厉…
 4月27日新闻早知道丨昨夜今晨…
 国台办发言人介绍近期两岸交…
 国台办回应率团访陆、M503航…
 柬埔寨发生弹药库爆炸事件造…
 国际观察:美方应当尽快移除…
 突发!一移民船在吉布提附近…
 北京理工导航控制科技股份有…
专题栏目
网络
您现在的位置: 时事新闻网 >> 时事新闻 >> 正文
高级搜索
自媒体人必备:文心一言、Kimi等4款AI大模型测评对比及推荐
作者:佚名 文章来源:本站原创 点击数: 更新时间:2024/5/4 1:31:34 | 【字体:

  现在,国内已经有海量大模型诞生,那么,哪款大模型的表现会更好?这篇文章里,作者站在自媒体人的角度,对四款大模型做了评估和对比,一起来看一下。

  说到AI,很多人会想到ChatGPT,而我们现在也有许多好用的国产AI大模型。

  在2023年的中国,8个月内诞生了238个大模型,阿里、华为、腾讯、京东、字节、360、科大讯飞等一众大厂纷纷下场,还有复旦、清华等高校机构加速研究,以及智谱AI、月之暗面等黑马出现。

  这些海量AI大模型里,子木挑选了4款市面上反响比较好的、也是我常用的AI大模型进行评估对比,帮助你选择适合自己的国产AI大模型。

  对于AI大模型的评估,目前还没有权威、统一的评估维度,我根据文案创作的需求、使用习惯,建立了自己的AI大模型内容创作评估维度:

  文本流畅度,用来评估AI生成的文案是否自然流畅,语法正确,符合人类日常交流习惯,我会用主题文章、简历撰写这两个题目来进行测试评估;

  个性化内容,用来评估AI是否可以根据我们输入的个性化要求,比如语气、风格等等来定制文案,满足不同的创作需求,我会用不同人物介绍同一个事物的2个问题来进行测试评估。

  用来评估AI模型是否具备特定行业或领域的专业知识,能否生成相关性强、准确无误的文案内容,我比较关注的是新媒体、教育培训行业,所以我一般会用这两个行业的代表性问题来进行测试评估,这一块每个行业的问题不一样,大家可以根据自己的行业来设计问题。如果有需要的话,也可以提问或联系我交流。

  用来评估AI创作内容的逻辑性,我会用公务员考试常用的逻辑推理题,和故事的续写这两个问题来测试评估,逻辑推理题是看它的推理过程,结果是否正确,而故事的续写,看情节是否合理、人物的行为是否符合逻辑。

  时效性决定了AI生成内容时是否能用到最新的案例或事件、我们在用AI寻找资讯时是否能给到最新的信息。我会用最新的热点事件、1个月前、3个月前的3个不同问题,来评估测试AI的时效性。

  AI作为一个辅助工具,是不是方便使用、使用成本如何,也是我们需要考虑的点。

  我把4个大模型写的“一花独放不是春”命题作文内容,给中学语文老师看了,满分60分,可以打到40分以上的程度,整体表现都还不错。

  文心一言4.0的文笔流畅度更高,文彩也更好。对于主题的整体理解更加准确,没有什么逻辑问题,可以算得上是一篇文采不错的作文。

  通义千问的流畅度也还不错,但是行文手法不如文心一言老练,比较中规中矩,相对文心一言4.0弱一些。

  kimiAI的语言流畅度跟通义千问类似,但对于主题的理解相对弱一些,文章的整体性相对最弱,有一些段落偏离了题目本身的意思。

  天工AI的行文流畅、老练,只是有一两个段落显得有些生搬硬套,前后意思不一致,有意思的是,天工AI表现出了比较强的政治素养,写出来的内容不像高考作文,而更像申论作文,做政务公文类的可以优先考虑天工AI。

  四个AI大模型都能够区分不同的口吻,同时,也能够区分不同的身份角色对于同一件事情所关注的不同的方面。

  从8岁女孩的角度来介绍一辆新能源车,4个大模型都会把重点放在了车子是用电的、很神奇的描述上,也都用到了小孩子能理解的语言,用打比方的、形象化的描述来讲这个车子。其中,kimiAI对于角色年龄的把握比其他三个大模型稍微弱一点。

  而从男企业家的角度来介绍新能源车,4个大模型都选择了将新能源车定义为这个企业家自己的产品,从更宏观的角度开始介绍这辆车,都表达了对于“未来出行”的创新和积极探索,侧重从技术的角度来介绍。

  4个AI都在很短的时间内给出正确答案,AI参加公务员考试,估计能秒杀99.9%的人。

  在回答的内容中,文心一言给到的思路最详尽、看起来条理也相对最清晰,而天工AI给到的思路最简略,没有描述太多的思考过程,我认为这是相对欠缺的。

  我在故事里设计了3个人物,发现藏宝地图的小明、他的好朋友小帅、妹妹小美,而故事也是围绕着寻宝的冒险之旅展开,这样,就能考察AI对于人物的设定,是否符合逻辑,以及故事线是否符合逻辑。

  在这个测试中,文心一言的表现相对较好,发挥了较强的对于人物风格的把控能力,能够在故事中写人物对线个人物的性格设定,故事内容更长,相对更细致。

  而通义千问则发挥了更多的创造力,赋予了人物更多不同的特点,不过内容更概括简短。

  kimi的表现与通义千问相似,也是通过赋予人物不同特点来塑造人物,对故事的描述更加细节一些,内容也稍长一点。

  天工AI的内容则更加简短,没有把控不同的人物风格、也没有赋予人物不同的特点,表现相对是最弱的。

  这是我非常非常看重的方面,在内容的创作中,引用时下的热点资讯,对于自媒体运营而言,是一种重要的能力,所以我们会需要时效性强的AI。我用最新、一个月前、三个月前的三个问题来进行测试。

  对于2月29日前的最新热点“董宇辉为什么清空微博”这件事情的解释上,通义千问、kimi、天工三个大模型都给出了正确答案,只有文心一言给出的答案不正确。

  对于一个月前哈尔滨的热点、三个月前的双十一销售额,则4个大模型都给出了正确答案。

  同时,文心一言、kimi AI都给出了答案所引用的参考资料,但文心一言给的参考资料,主要都来自百度系自己的内容,主要是好看视频、百家号,但这里存在一个bug:大语言模型不能解析视频内容,所以对于董宇辉为什么清空微博这件事情,文心一言虽然根据视频的标题,找到了好看视频中的参考资料,但是因为不能解析视频内容,找到参考资料也看不懂,就像找到一份天书,仍然只能根据自己的逻辑编造一个回答。

  而同样给出了参考资料的kimi AI,对于董宇辉清空微博的事件,则引用了更新的、也更全面的资讯。它引用了最近1天的内容链接,引用来源包括腾讯网、知乎、澎湃媒体等,搜索来源比文心一言更广。

  我在使用kimi AI搜索AI相关的内容时,它能给到的参考资料范围也很广、很精准,除了主要来源知乎之外,还会给到包括GitHub、人民数据、中国通信院,和一些可以公域访问的数据报告的链接,搜索能力和时效性是比较强的。

  另外2个AI大模型,通义千问和天工AI虽然没有给到引用链接,但对3个问题的回答都是准确的。

  所以在时效性上,kimiAI最强,它不仅能比较大范围地搜索到相关资讯,并且能给出引用链接,让我们能够直接通过链接,去判断这个内容的有效性、是否正确,通义千问和天工AI相对较弱,因为不能给出引用链接,对我们判断起来相对更困难一点,最弱的是文心一言。

  目前,4个AI大模型都能直接通过网页链接访问到,kimiAI、文心一言、天工AI都能在微信小程序里使用,非常方便,通义千问虽然没有官方的小程序入口,但是使用网页端也是比较方便的。在成本上,除了文心一言4.0需要49.9元的月费,或588.8元的年费,其他3款都是暂时免费。

  用kimiAI搜索资料、拓展内容,它是我目前比较喜欢用的搜索方式,在向kimiAI提问时,我会先看它给的回答,然后看它给的参考资料,其中有哪些资料是权威、官方的,比如数据报告等,在这些资料中找一找是否有新的信息。这样的搜索方式,比百度、小红书、微信搜索更加精准快速。

  文本创作时,我会倾向于用文心一言4.0,它生成的内容更加流畅、符合逻辑,内容质量相对更高。

  李子木说运营,公众号:李子木说运营,人人都是产品经理专栏作家。自媒体及IP孵化顾问,前互联网大厂品牌项目负责人,致力于研究企业及个人品牌影响力与获客。

时事新闻录入:admin    责任编辑:admin 
  • 上一个时事新闻:

  • 下一个时事新闻: 没有了
  •  
     栏目文章
    普通时事新闻 自媒体人必备:文心一言、Kimi等4款AI大模型测… (05-04)
    普通时事新闻 预告2024:为您精心挑选的必读新刊 (05-03)
    普通时事新闻 专门为中小学生打造的英文报刊精读值得学习! (05-03)
    普通时事新闻 2024南昌最新一周演出活动安排(持续更新) (05-03)
    普通时事新闻 海南省各级团组织将举办多场主题活动 (05-01)
    普通时事新闻 内蒙古自治区·吉林省经济合作座谈会在呼召开… (05-01)
    普通时事新闻 5·22国际生物多样性日活动将在海南举办 (05-01)
    普通时事新闻 人人都是朝阳“宣传员”!朝阳区新闻宣传公开… (04-30)
    普通时事新闻 喜讯! 吉林省新华书店集团农安县店获评全国“… (04-30)
    普通时事新闻 2024吉林省人力资源管理师报考入口及流程 (04-30)
    普通时事新闻 2023年12月6日新闻摘要与简评 (04-29)
    普通时事新闻 时政热点评析_3月1日今日时事要点摘抄 (04-29)
    普通时事新闻 时政热点评析_1月20日今日时事要点摘抄 (04-29)
    普通时事新闻 新闻发言人培训课程方案与心得 (04-28)
    普通时事新闻 学子不出校 尽知天下事|绵外魅力初中开设新闻… (04-28)
    普通时事新闻 通化消防圆满完成全省中小学《时事新闻课》录… (04-28)
    普通时事新闻 时政微观察丨从谢家铺到谢家湾都关心这件事 (04-27)
    普通时事新闻 每日时政内容摘抄:2022年11月29日公考时政常… (04-27)
    普通时事新闻 2022年2月公考时政常识每日主要内容文字版摘要… (04-27)
    普通时事新闻 昨夜今晨京津冀发生这些大事(2024年4月22日) (04-26)