

谷歌推出了 Gemini AI(雙子座人工智能),這是一種新的人工智能 (AI) 系統(tǒng),它似乎可以智能地理解和談?wù)搸缀跞魏晤愋偷奶崾尽獔D片、文本、語音、音樂、計算機(jī)代碼等等。
這種人工智能系統(tǒng)被稱為多模態(tài)模型。它超越了以往的人工智能系統(tǒng)只能處理文本或圖像的局限。它為人工智能的下一步發(fā)展提供了強(qiáng)有力的暗示:能夠分析和響應(yīng)來自外部世界的實時信息。
雖然 "Gemini "的能力可能并不像病毒視頻中看起來那么先進(jìn),它是根據(jù)精心策劃的文本和靜態(tài)圖像提示編輯而成的,但人工智能系統(tǒng)顯然正在迅速發(fā)展。它們正朝著能夠處理越來越復(fù)雜的輸入和輸出的方向發(fā)展。
為了開發(fā)新的能力,人工智能系統(tǒng)高度依賴于它們所能獲得的 "訓(xùn)練 "數(shù)據(jù)。它們通過接觸這些數(shù)據(jù)來幫助自己提高工作能力,包括進(jìn)行推理,如識別圖片中的人臉或撰寫論文。
目前,谷歌、OpenAI、Meta 等公司訓(xùn)練模型所依據(jù)的數(shù)據(jù)仍主要來自互聯(lián)網(wǎng)上的數(shù)字化信息。不過,人們正在努力從根本上擴(kuò)大人工智能的數(shù)據(jù)范圍。例如,通過使用始終在線的攝像頭、麥克風(fēng)和其他傳感器,就有可能讓人工智能了解世界上正在發(fā)生的事情。
實時數(shù)據(jù)
谷歌的新 "Gemini "系統(tǒng)已經(jīng)證明,它能夠理解實時內(nèi)容,如實時視頻和人類語音。有了新的數(shù)據(jù)和傳感器,人工智能將能夠觀察、討論現(xiàn)實世界中發(fā)生的事件并采取行動。
最明顯的例子就是自動駕駛汽車,它們在道路上行駛時已經(jīng)收集了大量數(shù)據(jù)。這些信息最終會儲存在制造商的服務(wù)器上,不僅用于車輛運(yùn)行的瞬間,還用于建立基于計算機(jī)的長期駕駛情況模型,以支持更好的交通流量,或幫助當(dāng)局識別可疑或犯罪行為。
在家庭中,運(yùn)動傳感器、語音助手和安全攝像頭已被用于檢測活動和了解我們的生活習(xí)慣。其他 "智能 "電器也不斷出現(xiàn)在市場上。雖然這種技術(shù)的早期用途很熟悉,例如優(yōu)化供暖以更好地利用能源,但對生活習(xí)慣的了解將變得更加先進(jìn)。
這意味著,人工智能既能推斷家中的活動,甚至還能預(yù)測未來會發(fā)生什么。例如,醫(yī)生可以利用這些數(shù)據(jù)來檢測糖尿病或癡呆癥等疾病的早期癥狀,并建議和跟進(jìn)生活方式的改變。
隨著人工智能對現(xiàn)實世界的了解越來越全面,它將成為人們生活中的伴侶。在雜貨店里,我可以為自己準(zhǔn)備的一餐討論最好、最經(jīng)濟(jì)的食材。在工作中,人工智能將能在面對面的會談中提醒我客戶的姓名和興趣,并為我推薦確保他們生意的最佳方式。在國外旅行時,人工智能能夠與我保持持續(xù)對話,介紹當(dāng)?shù)氐穆糜尉包c(diǎn),同時關(guān)注我可能遇到的潛在危險情況。
隱私影響
所有這些新數(shù)據(jù)都帶來了巨大的積極機(jī)遇,但同時也存在過度擴(kuò)展和侵犯個人隱私的風(fēng)險。正如我們所看到的,迄今為止,用戶非常樂意用大量的個人信息來換取免費(fèi)產(chǎn)品,如社交媒體和搜索引擎。
隨著人工智能逐漸了解并支持我們?nèi)粘I畹姆椒矫婷?,未來的交換將更加巨大,也可能更加危險。
如果有機(jī)會,該行業(yè)將繼續(xù)把數(shù)據(jù)收集擴(kuò)展到生活的方方面面,甚至是離線生活。政策制定者需要了解這一新形勢,并確保利益與風(fēng)險相平衡。他們不僅需要監(jiān)控新人工智能模型的威力和普及程度,還需要監(jiān)控其收集的內(nèi)容。
當(dāng)人工智能的能力擴(kuò)展到下一個前沿領(lǐng)域--現(xiàn)實世界時,只有我們的想象力才能限制其可能性。

