Open-AI 刚刚公(gōng)布了其(qí)大型语言模型(xíng)的最新版本 ——GPT-4。
GPT-4 可以更准(zhǔn)确地解(jiě)决你(nǐ)的难题,多模态的 GPT-4 还可以生成、编辑具有创意性或(huò)技术(shù)性的(de)文章(zhāng),在高级推理方面的表现超过其前辈(当前公(gōng)开版 ChatGPT 基于 GPT-3.5)。当然,正如大家所猜测(cè)的那样,微软 New Bing 的聊天功(gōng)能确实基于 GPT-4。
此外,该公(gōng)司(sī)正在与合作伙伴 Be My Eyes 一起测(cè)试 GPT-4 的图像输(shū)入(rù)能力(lì)(注:Be My Eyes 是一(yī)款即将推(tuī)出的(de)智能(néng)手机 App,可以识别场景(jǐng)并对其进行描述,类似于大家(jiā)常见的 AI 识图的加强版)。
除了介绍网站,OpenAI 还提供了描述 GPT-4 功能的技术性论文,以及详细描述其局限性的系(xì)统模型(xíng) Card。

OpenAI 计划通过 ChatGPT 及其商业 API 为用户提供 GPT-4 的文(wén)本(běn)功能(néng)支持,但目前还需要等待。IT之(zhī)家这(zhè)里需要提醒一下,GPT4 目前仅 ChatGPT plus 账号可用,可选 GPT4 模式进行对话(huà),每 4 小时限制发送 100 条消(xiāo)息。
收(shōu)费方面,大约 750 个单(dān)词的提示(shì)收取(qǔ)约(yuē) 3 美(měi)分的费用,约 750 个单词的响应(yīng)则(zé)收取(qǔ) 6 美分(就是问和答的区别)。

据介(jiè)绍,GPT-4 比(bǐ)以前(qián)的版本“更大”,这意味着它已经借(jiè)助比前辈更多的数据进行了(le)训练(liàn),并且在模型文件中有更多的权重,从而使(shǐ)得它的运(yùn)行(háng)成本更高。
就任(rèn)务(wù)而(ér)言,GPT-4 的表现比前辈更(gèng)好(hǎo),它可以遵循自然(rán)语(yǔ)言的复杂指令并生(shēng)成技术或创意(yì)内容,而且它(tā)可以还更深入地做到(dào)这(zhè)一点:它支持生成和处理(lǐ)多达 32768 个标(biāo)记(约 25000 个文(wén)本单(dān)词),从而(ér)实现比前辈更(gèng)长的内容创建(jiàn)或文本分析(xī)。
OpenAI 表示,GPT-4 错误答案更少,而且也会(huì)减(jiǎn)少偏离话题的可能,也尽可能不会(huì)再(zài)谈论禁忌话题,甚至在许多标准化测试中比人类表现得都(dōu)要更好一些。
例如,GPT-4 在模拟律师考试的成绩在考生中排名前 10% 左右,在 SAT 阅读考试中排名前 7% 左右,在 SAT 数(shù)学考试中排名前 11% 左右。相比之下,GPT-3.5 在律师考试中的得(dé)分(fèn)一般都是倒数 10% 左右。当(dāng)然,它们考个研究生还是没问题的(de)。

当然,AI 毕竟(jìng)是(shì) AI,OpenAI 也表示目前 GPT-4 并不(bú)完美,它(tā)在(zài)很多场景下(xià)的能(néng)力(lì)都不如人类。
据称,该模型仍然存在“幻觉”或编造(zào)事实的问题(tí),并且在事(shì)实方(fāng)面也(yě)不一(yī)定总是可靠的,“它倾向于坚持认(rèn)为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性,例如社会偏见、幻觉(jiào)和对抗性提示。