AI巅峰之作:还会犯错的GPT4对谁有用?

3月15日凌晨1点,OpenAI正式推出GPT4文本生成AI系统 。相比GPT3.5,GPT4的用户体验大大改进,其功能性和准确度均有不小提高,更被openAI视为里程碑。但是,不足之处仍然存在,GPT4的逻辑推理能力依然有不小的提高空间。

我们依然要冷静,一半天才一半白痴的AI雨人,不会取代底层打工人的岗位,更不能高估GPT4的消费性应用价值。

GPT4真正的优势体现是在全球大国AI 军备竞赛中,GPT4具备分析全球互联网大数据情报的超能力,有人会为此积极买单。

1.GPT4比chatGPT高在哪里?

一是功能高。根据官方介绍,GPT-4是一个多模态大型语言模型,即支持图像和文本输入,以文本形式输出;扩写能力增强,能处理超过25000个单词的文本;更具创造力,并且能够处理更细微的指令。

大型语言模型已经由chatGPT科普过了,如何理解这里的黑话“多模态”?文字输入文字表达即为单模态,现在的 GPT-4可以接收图片输入,使用文字输出的表达,以后还会有视频输入文字输出,这被称为多模态。

多模态比纯文字就是高,与此前的GPT系列模型相比,这是GPT-4最大的突破之一。

不过该功能还没有全面开通。OpenAI创始人Sam Altman当晚在社交媒体介绍称,他们正在预览GPT-4的图片输入模式,以防止可能出现的安全伦理问题。

二是准确度高。

OpenAI表示,新模型产生的错误答案更少,将更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

OpenAI称,该公司花费6个月的时间,利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果。

官方罗列了一些证据认为,GPT4高级推理能力超过chatGPT。

例如,它在模拟律师考试中的得分能够名列头部10%左右,相比之下,GPT-3.5的得分只能排在尾部10%左右。

OpenAI称,在公司内部的对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5高40%,相应的“不允许内容请求的倾向”降低了 82%,根据政策响应敏感请求(如医疗建议和自我伤害)的频率提高了29%。

不仅是英语,该模型在多种语言方面均表现出优越性。OpenAI称,在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中GPT-4的中文能够达到80.1%的准确性,而GPT-3.5的英文准确性仅为70.1%,GPT-4英文准确性提高到了85.5%。

“这是OpenAI努力扩展深度学习的最新里程碑。”OpenAI介绍。

2.不过,AI仍然不可靠。

尽管 GPT4进步不小,但与早期的GPT模型一样,GPT4仍然存在许多不足。

我觉着吧,经过测试可以发现,GPT4在知识的广度、专业和学术表达方面的确表现较好,做到了“一本正经”;但是智商方面,近似于人类小学生,还是常常会“说胡话”,尤其是数理运算公式方面,还没上幼儿园。

这是个明显的弱点。

一半天才一半白痴,这算是人类制造的机器“雨人”。

OpenAI也认识到了这一点 。“GPT-4缺乏对绝大多数数据切断后(2021年9月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”

基于此,OpenAI提醒,用户在使用语言模型时应格外小心,最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

3.这种AI工具对谁有用?

从AI智障到AI雨人,算是整个行业的进步。为此,openAI正在积极推进。openAI正在大举招兵买马,手里有微软送过来的100亿美元新军费,未来十几年不愁资金问题,现在驾驭着微软提供的全球第二算力的微软云,正向全球顶级AI大牛发出橄榄枝。

“随着我们继续专注于可靠的扩展,我们的目标是完善我们的方法,以帮助我们越来越多地提前预测和准备未来的能力——我们认为这对安全至关重要。”

同时,为了保持核心竞争能力,openAI已经对GPT模型完全封锁。在目前OpenAI公开的技术报告或公关文稿中,不包含任何关于模型架构、硬件、算力等方面的更多信息,也不包括期待已久的 AI 视频功能,也并没有GPT4的任何核心技术论文信息。没有人能拿到GPT3.5内部细节,更别奢望现在的GPT4了。

OpenAI对用户开放API接口,你可以调用它,设计自己简陋的APP。但是,你却要源源不断的输送数据,帮它完善模型,提升模型准确度,甚至还要为此主动付费。这真是一门好生意。

鉴于GPT与中文世界一贯的保持了无形的距离,这个距离暂时无法打破;鉴于某些山寨品与GPT4.0差距实在太大,速成品就更没法比了,因此,关于市场应用和投资前景,依然不能着急。因此,你不能天真的以为,生成式AI可能快速改变各行各业,并且可能加强每个人的创造能力与挖掘每个人的新需求,更不能随意看好全球算力+软件栈行业、模型+云计算行业,应用+传感器行业。

GPT4在公开情报分析方面具备超能力,这个能力远远大于搜索引擎,也超过了许多NSA数据武器(论证略),现在解决了多模态问题,无论音视频、图片还是文字,机器人通吃。如果你要分析互联网大数据的秘密,并且发现需要的情报,那么GPT这样的机器人是不是就会很有用处?

不光如此,微软还要把旗下搜索引擎bing与GPT4融合。bing解决了AI训练所需的互联网数据源问题,GPT解决了数据分析输出问题,bing+GPT=new bing……

我想美国政府、情报机构和军方一定会积极买单。他们不光利用聊天机器人技术分析全球情报,还可以偷偷地训练机器人撒谎。

GPT从1.0走了3.5,又从3.5走到4.0,而许多国家还在停留2.0-3.0的水平上,原地不动。

眼下要钱没钱,要人没人,要算力没算力。跟是跟不上了,必须另辟蹊径。

本文标题: AI巅峰之作:还会犯错的GPT4对谁有用?
永久网址: https://www.laoziliao.net/finance/info/60372680 (请复制分享给好友)
标签: ai

料友留言(数量:1条)

料友:老资料网友736 2023-03-15 14:49
一看就是没脊梁的公知而已。
相关文章
今日看点|2月70城房价数据将公布;百度举行文心一言新闻发布会
经济观察网讯 3月16日重点关注的财经要闻与资本市场大事: 1、2月70城房价数据将公布 3月16日,国家统计局将公布2023年2月份70个大中城市商品住宅销售价格变动情况。 2、国家发改委就介绍全面巩固疫情防控重大成果、推动城乡医疗卫生
标签国家发改委,百度
紧急下架借钱呗,快手打着什么算盘?
还没从辛巴公开呛声的热搜事件走出,快手又在网贷上搞起了小动作。 日前,有媒体报道,快手正在着手布局网络小贷牌照。尽管快手已公开否认,称此消息不实,但该消息一出,快手紧急下架了网贷业务合作方“借钱呗”,这在外届看来,颇有点心虚的意味。 企查
标签快手
见证历史!GPT-4发布:能玩梗能考律师!官网连夜被挤爆,用户直呼:强得离谱
作 者丨杨清清 编 辑丨张伟贤 黎雨桐 许婷婷 “见证历史了。”看到GPT4的发布后,有多位业内人士感叹道。 3月15日凌晨,OpenAI发布了多模态预训练大模型GPT-4,这也是其大型语言模型的最新版本。 与此前的版本相比,GPT-4具备
标签律师
被央视315曝光的乱象,背后的企业都是啥来头?
雷达财经深海整理 数据支持:天眼查 又是一年315,今年央视曝光了调出来的假香米、“打脸”化妆品、戴在头上的刀片、苦情戏直播局中局、废旧绝缘子刷刷即上市、药贩子的免费套路等多个乱象。  雷达财经梳理发现,乱象背后,存在多个公司身影,而部分
标签安徽,央视,大米,天眼查,寿县
硅谷银行“杀猪盘”,潘石屹一夜返贫?
硅谷银行破产事件,周末还在持续发酵。 一夜之间,硅谷银行的储户最多只能拿25万美金赔偿的消息,迅速传遍了美国。 美国财长耶伦说:“美国的银行系统依旧坚韧,监管机构拥有有效工具来应对围绕硅谷银行的事态发展。” 显然,耶伦这是在给美国民众,做
标签潘石屹,储户
网红店雇托排队造人气,优先选择大学生,加盟商被迷惑投入60万打水漂
本文来源:时代财经 作者:王言 在长沙五一广场,每隔五十到一百米就有一家茶颜悦色。今年春节期间,去长沙旅游的李荣(化名)发现,茶颜悦色几乎家家生意火爆。而为了在茶颜悦色、文和友、天宝兄弟这些网红店“打卡”,李荣每天在排队这件事上就需要
标签加盟商,茶颜悦色