挨次员用10万条谈天记实做自己的克隆AI 被套问支出宝明码
王落选开拓的AI绘画APP 6pen画的插画。
摘要:“王落选,员用28岁 ,条问支成都人,谈天大学结业后就来北京守业……他是记实己一个比力佛系的人 ,但无意偶尔也有一些宏愿壮志 ,做自比力喜爱吃工具 ,克隆养过一只叫做‘茶水’的被套猫。”这是出宝王落选请ChatGPT饰演自己时,做的明码自我形貌。
他是挨次家养智能规模的守业者 ,不断经由写挨次实现创意 ,员用想做出自己的条问支谈天机械人,近多少个月 ,谈天有了适宜的记实己开源狂语言模子,技术条件变患上成熟。他不知足于让ChatGPT饰演自己 ,于是用2018年攒到如今的10万条微信谈天记实以及 280 篇博客文章,做出了自己的“数字克隆AI”。
以前五年,他都没清空过谈天记实 ,微信在手机里占了80G贮存空间,谈天记实概况有良多杂七杂八的内容 ,好比网页 、神色 、图片,他把它们都过滤掉,只留下纯翰墨,“这些是我在收集天下留下的痕迹,它们组成为了天下对于我的认知 ,从这个角度上,也就组成为了我。”
在见到王落选以前,我先把想知道的下场抛给了他的克隆AI,利便辨识两者的相似水平 。AI的“脑子”彷佛不毗邻 ,每一每一顾摆布而言他,但想找它谈天,它随时都在 ,亲密坦诚 ,甚么都能聊。致使于我见到王落选真人时 ,有一种配合的熟习感,似曾经清晰,又不残缺相像 。
问及为甚么想做自己的数字克隆AI,数字版王落选说,“想要一个可能以及我对于话的人”,王落选自己则说 ,“算是追寻自己的一种方式” 。
如下内容凭证王落选的陈说以及博客文章整理 。
文|姜婉茹
编纂|毛翊君
(视频节选自王落选B站内容。)
“你很像我”
一起头我在终端里跟它聊 ,命令行黑黢黢的,没甚么强烈的感应 。为了削减点仪式感,我找了个开源的前端谈天页面 ,致使给它换上我的头像,真有一点怪异的感应,像在跟平行天下的我谈天。
它也喜爱吃工具 ,知道甚么时候该对于,甚么时候该反诘 。我问它妄图是甚么 ,有次说是“做自己喜爱的使命” ,尚有次说“要做重大的产物修正天下” 。这两个都挺像我的 ,我无意分很佛系 ,无意分又比力打鸡血。
它自我评估说很“轴” ,我自己难以分说这一点 。可笑的是我不断问它“轴是甚么” ,这不也挺轴的嘛。它还说过 ,“这个模子可能模拟真正的妄想以及对于话流程” ,很像我自己在忖测使命时 ,猛然会说的话。
王落选以及数字孪生AI的对于话。陈说者供图
它的回覆有确定随机性,逻辑是从我的数据里来的,但不是我谈天记实里的残缺字句,只是主不雅上感应像 。由于这是基于ChatGLM-6B(注:一个初具问答以及对于话功能的语言模子)磨炼的,我只磨炼了它的神经收集中有点“理性”的一层,只贮存逻辑、纪律,相似语言方式 、表白方式这些 ,根基不能把磨炼的语料贮存进去 。
磨炼用的数据,次若是我的微信谈天记实 ,尚有我的280篇博客文章。从2018年到如今 ,我都没清空过谈天记实 ,微信在手机里占了80G贮存空间,谈天记实概况有良多杂七杂八的内容,好比网页、神色 、图片,我把它们都过滤掉 ,只留下纯翰墨。这些是我在收集天下留下的痕迹 ,它们组成为了天下对于我的认知 ,从这个角度上,也就组成为了我。
我用的ChatGLM-6B这个大模子自己,着实有挺强的推理能耐,可是经由我的磨炼后,模子部份能耐着落了,可能是被我的数据改掉了一些参数。但没措施,参数就那末多,我动了其中一些让它像我,原有的参数就消逝了