AI编辑大挑战：文心、豆包亮眼，但离科技媒体合格编辑还有多远？-数码-沃资讯

AI编辑大挑战：文心、豆包亮眼，但离科技媒体合格编辑还有多远？

发布时间：2024-11-26 16:22 来源：ITBEAR 作者：苏婉清

在人工智能技术的快速进步下，各大AI大模型的应用日益广泛。然而，近日一组关于AI大模型在不同任务中表现的测试结果显示，这些模型在实际应用中仍面临诸多挑战。测试涵盖了总结PDF文件、撰写发布会报道以及生成文章配图等多个方面。

首先，在总结PDF文件的任务中，尽管豆包AI大模型在内容上表现较为出色，包含了一定的数据和分析，但其他模型如讯飞星火、Kimi、文心3.5和GPT-4o则显得力不从心。讯飞星火的内容过于简练，缺乏详细分析；Kimi和文心3.5则更像是一份大纲，缺乏实质性信息；而GPT-4o甚至直接表示无法处理PDF文件。

在撰写发布会报道的任务中，豆包和文心3.5表现出色，能够提供详细且准确的信息，文章条理清晰。豆包的文章原创度超过50%，虽然段落间转折略显生硬，但整体上已经是一篇合格的报道。文心3.5的文章则更加紧凑，数据准确，行文流畅，接近真人撰写水平。相比之下，讯飞星火虽然内容简练且原创度较高，但存在小错误；Kimi则错误连连，数据不准确；GPT-4o的内容则显得敷衍，水土不服现象明显。

在生成文章配图的任务中，各模型的表现也参差不齐。讯飞星火和文心3.5能够生成相对符合要求的图片，但讯飞星火缺乏风格选择和后期处理功能，文心3.5的图片分辨率较低。豆包虽然提供了丰富的风格选择和后期处理功能，但在理解自然语言并准确绘制图片方面仍有待提高。GPT-4o则完全未能正确理解指令，生成的图片存在明显错误。

综合三轮测试的结果，文心3.5和豆包在整体表现上较为突出，讯飞星火次之，而Kimi和GPT-4o则相对较弱。尽管AI大模型在某些任务中已经展现出了强大的能力，但在实际应用中仍面临诸多挑战，如理解自然语言、准确生成内容以及提供丰富的后期处理功能等。

值得注意的是，AI大模型在处理长文本和复杂任务时仍显得力不从心，容易出现信息缺失或错误。因此，即便未来AI大模型在媒体行业得到广泛应用，仍需要专业编辑进行审核和整理，以确保内容的准确性和可读性。

尽管如此，AI大模型的快速发展仍然令人瞩目。从最初的一片嘲笑到如今被广泛接受并应用于各个领域，AI大模型的进步有目共睹。未来，随着技术的不断进步和应用的不断拓展，AI大模型有望在更多领域发挥重要作用，为人类社会带来更多的便利和创新。

更多>同类内容