CENSORED
STATUS: RESCUED DATE: 未知

【404文庫】「也許五年後,在地球絕大部分地區,GPT取代了谷歌,但是大陸還在用百度」(外二篇)

CDT 檔案卡
標題:【404文庫】「也許五年後,在地球絕大部分地區,GPT取代了谷歌,但是大陸還在用百度」(外二篇)
來源:微信公眾號「紅博士說」、網易新聞、知乎
來源:中國數字時代
主題歸類:ChatGPT CDS收藏:時間館
版權說明:該作品版權歸中國數字時代所有,歡迎個人、媒體和研究機構在註明來源的前提下免費使用。詳細版權說明

《404檔案館》講述中國審查與反審查的故事,同時以文字、音頻和視頻的形式發布。播客節目可在 Apple Podcasts, Google Podcasts, Spotify 或泛用型播客客戶端搜索「404檔案館」進行收聽,視頻節目可在Youtube「中國數字時代· 404檔案館」頻道收看。

歡迎來到404檔案館,在這裡,我們一起穿越中國數字高牆。

儘管中國的言論審查和輿論管控日趨嚴峻,國家對公民的監控也無處不在,但我們依然可以看那些不服從的個體,頂著被刪號、被約談、甚至被監禁的風險,對不公義勇敢發出自己的聲音。

中國數字時代在「404文庫」欄目中長期收錄這些被當局審查機制刪除的聲音。

本期節目,我們選讀過去一周中引起輿論關注的三篇404文章。

一、紅博士說|中國如何缺席CHATGPT盛宴

2022年11月,OpenAI開發的一個人工智慧聊天機器人程序ChatGPT被推出。該程序使用基於GPT-3.5架構的大型語言模型並通過強化學習進行訓練。

2023年2月,ChatGPT開始在中國網際網路上爆火。但早在2022年12月它推出之時,就引爆了全球網際網路,發布兩周之內用戶即破億,熱度經久不衰。

2月2日,微信公眾號「紅博士說」發布文章《中國如何缺席CHATGPT盛宴》。

作者在文中梳理了ChatGPT的時間軸,ta寫道:

2020年

年初,Covid-19爆發。中國閉關。

5月,GPT-3論文發布。

6月,GPT-3 API發布。

9月,ChatGPT的關鍵原型算法相關論文發布。

12月,歐洲機構發布用於GPT-3復現的開源數據集。

2021年

11月,GPT-3 API Public Release,不對中國開放。

中國閉關。

2022年

12月1日,ChatGPT發布。Musk等名流開始談論ChatGPT,引爆英文網際網路。

12月初,中國網際網路的自媒體逐漸開始討論ChatGPT,主要以翻譯twitter的方式。知乎上有學者開始反思。一周後,關注指數下降,兩個月來只剩下AI自媒體把ChatGPT作為自己的主要關注內容。

中國閉關。

2023年

1月,微軟宣布投資OpenAI數十億美元,並將GPT加入全家桶。

2月,中國春節結束,微軟和Google你方唱罷我登場,納斯達克財報季,AI被反覆提起。中國網際網路是認識微軟的,ChatGPT引爆中國網際網路,關注指數飆升。

中國開放。

值得注意的是,中國因為疫情閉關的三年,正是OpenAI的GPT發展、壯大、產品化的三年。

10年來,我們以為自己積攢的AI算法、數據、應用的優勢,如今變成中美巨大的鴻溝。這個時候,我們甚至沒有一個新聞調查,把這件事的來龍去脈,挖它個底朝天。

另一個問題是,我們的中文網際網路不足以提供高質量的訓練數據。什麼是高質量的數據?比如維基百科、高質量的活躍論壇、專業新聞、學術論文、高質量代碼、圖書。

沒有好的中文數據,我們就只能搭全球網際網路的數據順風車。上面這些優質數據的產生,需要開放的社區,我們似乎無解。

二、知乎網友|國內研究CHATGPT的主要阻礙是怕它亂說話

在知乎上,一名網友發起了提問「阻礙國內團隊研究ChatGPT這樣產品的障礙有哪些,技術,錢,還是領導力?」,評論區有一條回復遭到了刪除。

ta寫道:

主要阻礙是怕ChatGPT亂說話……大語言模型完全是黑箱,你不能保證他永遠不說一些不興說的東西,一旦說錯話對任何一個公司都是毀滅性的打擊。所以根本不會有團隊去做,做出來了也不可能開放給普通人用。也許五年後,在地球絕大部分地區,GPT取代了谷歌,但是大陸還在用百度。

中國數字時代編輯同時摘錄了一些其他用戶的回覆:

lili:首先得讓AI具備識別一切敏感點的能力。不但得能識別過去和現在的。還得可以預測未來的,起碼10後的。估計550W的算力不夠,550WWWWWW也許成。

知乎用戶:方向。這個東西一定會被拿來做審核機器人的,我碰到過好幾個這樣的團隊了。絕對不可能拿來做大模型公開使用的,不然競對直接惡意提問+舉報,能把你搞到破產+吃撈飯。

顧塵:追求自由的環境吧,第一,學者有自由研究的習慣和空間,第二,非官方研究機構有空間做大做強,第三,有政策環境和法律保障保護參與貢獻者包括個人和公司的合理回報。

羨魚智能:最大的阻礙是眼界、風氣。創新是有失敗風險的,而跟風就穩妥多了,擅長後發制人。站在國外成果的肩膀上,搞個XX中文版,雖然不一定能吃上肉,但肯定能喝到湯,贏麻了!可惜,有些東西還真復刻不出來,這時候就會說,他們怎麼不開源!

Out Man:一個問題+一個答案,也許一個產品就沒了,有哪個資本敢投?就算你好不容易讓這個產品苟活下來,也早已面目全非了,甚至很可能你花在人工篩選上的成本都超過研發投入了。

知乎用戶:你如果,非要刨根問底,非要每一個事情的原因都說明白。那麼我只能說,到最後,會發現是意識形態問題。這不是我的主觀猜測,這是一個客觀事實罷了,而且大部分人心裡都清楚,就是嘴上要辯解。這也很正常,屁股決定腦袋。

巴拉丁:想平地起高樓,要先打好地基,地基都沒得,你也就能起個三層小洋樓。

嘉心糖P用沒有:我有一個想法,我們可以研究一個審核chatgpt說話的ai,我們不能隨便說,但是我們可以隨便不說!審核AI-chineseGPT,項目立項了之後,其實只需要加一個敏感詞庫,經費來!

三、網易新聞|官媒尷尬了,為什麼越來越多的人都不相信勤勞能致富了?

2月9日,人民網發布了一篇名為《好好幹,日子會越來越甜》的文章,試圖傳播「正能量」。然而,這篇文章卻引發了網友熱議,越來越多的人不相信勤勞能夠致富。

2月14日,在網易自媒體平臺「網易號」上,一篇名為《官媒尷尬了,為什麼越來越多的人都不相信勤勞能致富了?》被發布。

文中寫道:

按道理說,中國經歷了3年疫情,在這3年裡,人們的生活過得非常的苦,很多人因為疫情失去了工作,失業在家,還不起房貸和車貸,所以很多人經濟發生了一些翻天覆地的變化。

以前有疫情,賺不到錢可以怪疫情,現在疫情放開了,沒有理由沒錢了,再沒錢就說不過去了。再沒錢就是你不努力了。

所以人民網的作者才想到寫這麼一篇小短文來鼓勵大家吧,小短文是真的很甜啊,但是甜甜的小短文沒有獲得老百姓的一致好評,反而還受到了越來越多的嘲諷,為啥為啥呢?

我就拿我身邊的人來舉例子吧,從我身邊的人身上我看到了,其實努力幹,真的賺不到錢。

我老公有一段時間晚上去送外賣,一單才掙5塊錢,從晚上八點跑到晚上12點才賺了三十幾塊錢,一個月才賺了800塊錢,這800塊錢能幹啥啊?

關鍵是送外賣很辛苦啊,颳風下雨天氣那麼冷,雨水打到臉上多難受,衣服都淋溼,爬樓梯,這麼辛苦,一天才賺30塊錢,好點的情況下賺50塊。

冬天冷的要命,夏天熱的要命。

你說他不吃苦嗎?他也吃苦了,但是收益很小啊,和付出的勞動不成正比。

但是你看某些人,一杯茶,一份報紙,日上三竿才到單位,到單位報個道,坐那裡喝喝茶,醒醒酒,中午出去陪情人約會,晚上高檔娛樂場所玩一玩,人家一年賺的錢都比我們一輩子賺的都多,人家貪汙的錢,比我們後代幾輩人賺的都多,這樣的日子多麼瀟灑?快樂似神仙。

以上是本期選讀的三篇404文章。這些作品版權歸原作者所有。中國數字時代僅對原作進行存檔,以對抗中國的網絡審查。

中國數字時代 CDT 致力於記錄和傳播中文網際網路上被審查的信息,以及人們與審查對抗的努力。歡迎大家通過電報(Telegram)平臺 向我們投稿,為記錄和對抗中國網絡審查作出你的貢獻!

cdtimg

了解更多投稿信息,請閱讀中國數字時代徵稿說明

歡迎讀者訪問 CDT播客CDT視頻 收聽/觀看更多相關內容。



[ 🔙 斷開連線 / 返回檔案庫主機 ]