大语言模型中的涌现现象是不是伪科学？

发布时间:2023-06-11 00:26:18 来源：程序员客栈

Datawhale干货

作者：平凡@知乎，诺桑比亚大学，在读博士

(资料图片)

今天晚上，花了一点儿时间看了两篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

这两篇讲的都是emergent behavior，即涌现现象。

大规模神经网络下的涌现现象

在机器学习中使用大规模神经网络时，由于增加了参数数量、训练数据或训练步骤等因素，出现了定性上的新能力和性质，这些能力和性质在小规模神经网络中往往是不存在的。

第一篇文章举了这个例子，每个图都可以理解为一个任务，横轴是神经网络的规模，而纵轴是准确率，可以理解为模型的性能。

我们拿图一来看，在10的22次方前，这些模型基本上的性能基本上都很稳定在0附近，而在10的22以后，突然在10的24次方上获得了很大的性能提升，在其他的几个任务上都表现出类似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的评论引用在这里：

作者发现，当我们训练用网络计算同余加法 a+b = ? (mod c) 时，网络在某个时间突然获得了 100% 准确率。分析发现，神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法！这个算法可以证明是正确的，反人类直觉的。

从这俩例子里面我的感受是，只要数据量足够且真实，且模型没有硬错误的前提下，不断的训练说不定真的能够产生一些意想不到的效果。

还有就是我觉得人类现在积累的知识并不少，但是系统的少，零星的多，如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话，我觉得有很大概率会让它涌现出意想不到的能力。

甚至可能把人类的生产力解放提前很多。

参考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

x 广告

大语言模型中的涌现现象是不是伪科学？

大语言模型中的涌现现象是不是伪科学？

热点聚焦：途家网怎么样（途家网）

磁感应强度与磁场强度的区别（磁感应强度和磁场强度的区别）|天天播资讯

世界观天下！绵阳有什么土特产可以送礼的

一台无人机相当于25名工人，江陵县水稻种植运用无人机撒播

环球百事通！乌海京东到家代运营公司_提供专业的代运营服务

世界热资讯！阴阳师樱花妖技能什么意思（阴阳师樱花妖的夫君是谁）

今日快讯：不尽长江滚滚来上一句_不尽长江滚滚来上一句是什么

各地税务部门不断优化服务 前5个月新办涉税经营主体643.5万户

证监会就公募基金投顾业务管理规定公开征求意见-焦点关注

全国停车位缺口达到8000万，停车贵、停车难到底怎么办？ 今日热门

1-5月芯片数据：中国少进口3000亿元，455亿颗，少出口137亿颗

从8000年前的刻符龟甲说起 成博新展用220件重磅文物解读“汉字中国”｜文化和自然遗产日_焦点播报

中超积分榜：海港领跑三镇仅第8 大连人倒数第一

【天天聚看点】法官是什么生肖(十二生肖中形容法官的是哪个动物?)

地包天自我矫正方法（地包天矫正方法）

广汇汽车与工行江西省分行签署战略合作协议

【新要闻】张建坤深入高考点巡查护考护安情况

怎么设置电脑密码锁屏时间（怎么设置电脑密码）-全球快报

网关设备怎么配置（网关设备）_每日动态

即时看！高腰紧身牛仔裤，时髦又百搭，搭配黑色吊带，显得身姿曼妙

西安高新区2023“文化和自然遗产日”主题活动启动

年内定增募资排行榜：7家公司募资超百亿元 全球信息

英语四级多少分算过2021 英语四级多少分算过

俄媒：俄国防部公布乌军装甲车辆被摧毁视频，引用二战时期经典语录 每日速看

顾家，爱妻！把家庭看得比事业重的生肖男，嫁给他们很值得 每日焦点

厦门信用就医“亲情付”上线 热议

教育部印发《意见》 加强中小学地方课程和校本课程建设与管理-每日讯息

乐福洛瑞返老还童难救主 热火1-3陷绝境已被逼至悬崖边

微速讯：自动驾驶的“奇点”时刻将近？余承东“剧透”这一时点

今热点：61岁亚视一哥享受单身，自夸年年18岁！前任曾华倩批其大男子主义

世界今日报丨网红宏楠女友抢账号，网红宏楠怎么了

央妈狂买620亿黄金，背后是大智慧！

全球滚动:@考生和家长 涉高考诈骗重要提醒！

50岁大叔当主播，养活一个剧团！

沃格尔：未来几年我们都可以去争冠 这是太阳最好的时代

滚动：月经期可以吃什么(来例假时吃什么比较好)

“文根”何以“深种”？看文博会如何寻找岭南新坐标 当前滚动

打印机驱动无法安装 HP1106打印机驱动无法安装_天天最新

全球快看点丨武内直子为什么不画美少女战士（美少女战士 日本武内直子创作的漫画作品）

六台记者：关于凯恩的签约，他将在明夏加盟皇马 每日信息

中国代表揭批美英澳核潜艇合作：掩耳盗铃 暗度陈仓_全球播资讯

j的拼音格式怎么写的_j的拼音格式怎么写|聚看点

美股充电桩板块走弱，Chargepoint跌近10%-全球消息

安全“巡演”进校园，人人都能当“演员”——姜堰区创新推出应急救护知识进学校主题活动

根据《汉堡晨邮报》的说法，卡特巴赫的健康状况正在...

破解“天书”！全世界的谷子均来自中国 通讯

神仙道3周末福利有什么 神仙道3首周活动一览-世界新资讯

今日看点：20名“驴友”被困大冶毛铺深山 救援人员连夜进山成功施救

武汉出台推进进口贸易“二十二条”

中国科学家成功克隆广谱抗根肿病基因 以西汉名将卫青命名

m2ts是什么格式的视频（m2ts是什么格式）

关于肖战个人资料年龄身高简介 X玖少年团成员资料肖战的相关信息_微动态

电弧电流的本质是离子导电（离子化合物一定能导电）-当前热门

焦点滚动:深夜人孤独的文案

恩施州气象台发布大雾黄色预警【III级/较重】【2023-06-09】 天天简讯

世界视讯！一淘是什么流量来源_一淘是什么

当前热门：红米k40pro摄像头介绍

粉皮要泡多久 粉皮要泡多长时间

陕西柳林：生态与产业融合发展 小小香菇“飘香”乡村振兴路|世界观热点

天天资讯：江苏中考时间2023年具体时间表

暗月马戏团奖券都能兑换什么_暗月马戏团奖券-每日视点

当前短讯！关于雨的成语俗语诗句 关于雨的成语

【全球播资讯】帝尔激光：可转债转股价格调整为74.38元/股

大盘现弱反弹 持续性有待观察-今头条

易极：6.8原油72.2多单起飞！

当前通讯！北京市通信管理局就网络安全问题约谈瑞斯康达

两市主力资金净流出211亿元 银行等板块实现净流入_全球速讯

旗委书记王刚赴上海市开展招商引资工作

大暑是什么意思大暑的含义（大暑是什么意思）_全球播资讯

【当前热闻】武汉邓南振兴街社区开展安全生产月宣传活动

开滦股份：业绩说明会定于6月16日举行 世界新动态

定向志愿报不报（定向志愿可以不填吗）_世界速读

奥瑞金：拟发行可转债募资不超9.4亿元事项获深交所审核通过

土耳其5年期信贷违约掉期（CDS）上涨31个基点，达到513个基点，为5月15日以来最大涨幅。

【汽车人◆葳漪专栏】国六b才来？又提国七？ 全球即时看

亿纬锂能：孙公司拟在匈牙利投资建设乘用车大圆柱电池项目 焦点热闻

oracle insert into语句（insert into 语句） 今日热文

5G产业深度调研及投资分析

各地税务部门不断优化服务前5个月新办涉税经营主体643.5万户

全国停车位缺口达到8000万，停车贵、停车难到底怎么办？今日热门

从8000年前的刻符龟甲说起成博新展用220件重磅文物解读“汉字中国”｜文化和自然遗产日_焦点播报

年内定增募资排行榜：7家公司募资超百亿元全球信息

俄媒：俄国防部公布乌军装甲车辆被摧毁视频，引用二战时期经典语录每日速看

顾家，爱妻！把家庭看得比事业重的生肖男，嫁给他们很值得每日焦点

厦门信用就医“亲情付”上线热议

教育部印发《意见》加强中小学地方课程和校本课程建设与管理-每日讯息

乐福洛瑞返老还童难救主热火1-3陷绝境已被逼至悬崖边

全球滚动:@考生和家长涉高考诈骗重要提醒！

沃格尔：未来几年我们都可以去争冠这是太阳最好的时代

“文根”何以“深种”？看文博会如何寻找岭南新坐标当前滚动

全球快看点丨武内直子为什么不画美少女战士（美少女战士日本武内直子创作的漫画作品）

六台记者：关于凯恩的签约，他将在明夏加盟皇马每日信息

中国代表揭批美英澳核潜艇合作：掩耳盗铃暗度陈仓_全球播资讯

破解“天书”！全世界的谷子均来自中国通讯

神仙道3周末福利有什么神仙道3首周活动一览-世界新资讯

今日看点：20名“驴友”被困大冶毛铺深山救援人员连夜进山成功施救

中国科学家成功克隆广谱抗根肿病基因以西汉名将卫青命名

恩施州气象台发布大雾黄色预警【III级/较重】【2023-06-09】天天简讯

粉皮要泡多久粉皮要泡多长时间

陕西柳林：生态与产业融合发展小小香菇“飘香”乡村振兴路|世界观热点

当前短讯！关于雨的成语俗语诗句关于雨的成语

大盘现弱反弹持续性有待观察-今头条

两市主力资金净流出211亿元银行等板块实现净流入_全球速讯

开滦股份：业绩说明会定于6月16日举行世界新动态

【汽车人◆葳漪专栏】国六b才来？又提国七？全球即时看

亿纬锂能：孙公司拟在匈牙利投资建设乘用车大圆柱电池项目焦点热闻

oracle insert into语句（insert into 语句）今日热文

苏州市相城区人大常委会党组成员、副主任李彩男接受纪律审查和监察调查世界今热点

南通12.2亿成交3宗宅地总建面36.8万平方米

健康海南行动推进委员会办公室调研查摆健康海南行动短板微速讯

【收评】豆油日内上涨0.03% 机构称油脂反弹乏力精选

王志文前妻是谁王志文有几任老婆（王志文前妻）全球热点评

【环球速看料】美联储下周加息概率骤降黄金期货弱势震荡

电子后视镜新国标将于7月实施行业市场规模有望超60亿

雷雨大风+冰雹+龙卷！黑龙江省发布龙卷预警全球动态

天奥电子：中电十所是公司的控股股东，中电天奥是中国电科的全资子公司环球新资讯

热议：【收评】橡胶日内上涨1.94% 机构称橡胶基本面缺乏指引宏观面主导胶价走势

分享几款值得剁手的适合送给情侣的礼物

智微智能：公司在数据通信、网络安全等方面均有布局，包括L2、L3、数据中心交换机全球热点

世界速讯：广发基金王瑞冬：把握医药投资机遇挖掘“三低长尾龙头”

燃烧的三个必要条件和灭火方法_燃烧的三个必要条件每日头条

债市日报：6月7日全球快资讯

兴华消费精选6个月持有期混合增聘崔涛冷文鹏离任|每日看点

轻断食的具体方法三天瘦八斤_轻断食的具体方法焦点热议