有點恐怖。 現(xiàn)在,AI只需隨意一張照片,就能知道你在哪里,而且是可以精確到經(jīng)緯度的那種! 例如下面這張隨便到不能再隨便的自拍,你能猜到小姐姐在哪里嗎? 這事交給現(xiàn)在的AI來處理,它只需要“看”一眼,就能把照片里的“底褲都給扒出來”: 美國,加利福尼亞州,舊金山機場洗手間,93號登機口附近…… 坐標:37.6189° N,122.3744° W 再如下面這張照片,AI根據(jù)湖的特征、樹木和背景中的山脈,就匹配到了瑪麗湖,同樣是給出了精準的坐標: 恐怖如斯,恐怖如斯。 至于這個AI工具,則是最近由一位俄羅斯黑客所推出,名叫GeoSpy,號稱是可以根據(jù)照片里的各種細節(jié)做分析來判斷地理位置。 包括光線、植物、建筑風格、天氣,并將它們與大量街景/地理照片進行對比,據(jù)說也用到了地理空間視覺大語言模型的技術。 而GeoSpy的功能,像極了此前一款基于谷歌地圖的游戲GeoGuessr—— 游戲中會展示一張街景圖,然后玩家要從地圖上找到它的坐標位置;給出答案與正確坐標越近,分數(shù)越高。 之前也有一位國外小哥(ID:georainbolt)憑借只需看0.1秒街景,就能在世界地圖上快速鎖定位置而在網(wǎng)絡上躥紅。 果不其然,斯坦福計算機系學生Andrew Gao在嘗試了GeoSpy之后,就開始喊話這位小哥了: 你要失業(yè)嘍~ 不過也有GeoGuessr的職業(yè)玩家坐不住了,站出來表示不服: 申請一戰(zhàn)! 人類 vs AI 這位挑戰(zhàn)者,名叫做Gavin(下文我們簡稱“G哥”),是一位正在參與GeoGuessr 2024世界杯的職業(yè)選手。 G哥把他跟AI在線對壘的情況上傳到了網(wǎng)上。 規(guī)則和GeoGuessr一致,還是看圖猜位置。 在第一輪對決中,G哥憑借抓到了馬路道邊上土耳其樣式柱子的細節(jié),判斷這張圖可能是在土耳其附近。 結果顯示,這張圖里的位置確實是在土耳其附近,但距離精準的位置還差241km。 接下來就輪到GeoSpy這個AI選手登場了。 G哥處理的方式是將截圖“投喂”給AI,在靜候了片刻之后,GeoSpy就給出了結果。 國家:土耳其 經(jīng)緯度:39.998923, 32.607491 然后G哥在地圖中搜索這個經(jīng)緯度,再跟GeoGuessr的“標準答案”做比較: 第一輪的結果可以說是讓G哥大受震驚,GeoSpy給出的位置比他的更近……來看下G哥當時的表情: 在接下來的“火拼”中,G哥變得更加仔細,都湊近屏幕去捕捉細節(jié)了。 G哥這次給出的答案是蘇門答臘島,但實際的結果卻不是很理想,距離“標準答案”足足703km。 到了GeoSpy這邊,雖然大致位置都是在印度尼西亞,但這次給出的位置就沒有那么準確了。 不過比起G哥給出的答案,距離上卻還是AI的答案更近些,這使得G哥開始有點無語子…… 在接下來的比試中,即便G哥把猜測距離壓縮了86km,但GeoSpy給出的結果又是更接近于“標準答案”。 G哥此時已經(jīng)開始掩面了: 在最后一輪battle中,G哥直接說出: 人類必須反將AI一軍。 然后G哥把頭埋得更深了,當他捕捉到圖中路邊有文字時,臉上露出了得意的笑容: 這局穩(wěn)了,AI它不識字的。 G哥的結果是,距離標準答案134km。 不過令G哥萬萬沒想到的是,GeoSpy,它!識!字! 這張照片是在波蘭拍攝的,因為建筑物上寫著“Abet”,這是一家波蘭公司。 然而G哥還是覺得這把有希望,因為他發(fā)現(xiàn)GeoSpy只能定位到城市。 所以這把如果AI給出的坐標是“標準答案”旁邊的城市“華沙”,那么G哥就贏了。 結果還真是……G哥也是露出了久違的笑容,并驕傲地說: AI永遠不會打敗人類! (Emmmm……G哥,你非要這么算的話……也行。) G哥在下一輪的比拼中,將地圖范圍縮小到了自己的老家——芝加哥。 這次在自己的地盤上,G哥的表現(xiàn)非常勇猛,有距離“標準答案”僅2m和4m的成績。 不過AI這邊也是非常精準,起碼在看圖描述的過程中可以精確地說出周邊的地址,這也讓G哥著實捏了一把汗。 但在地圖上搜AI給出的坐標的時候,卻比文字描述的地點遠一些了,有的甚至還定位到了海上。 …… 最后,G哥在與AI交鋒了數(shù)次之后感慨道: 這次體驗非常有趣并且讓人印象深刻。 但我也害怕這樣的技術在未來5年后會迭代到什么樣的程度。 也會頻頻翻車 其實在剛才G哥體驗的過程,我們就能發(fā)現(xiàn)GeoSpy也存在一定的bug。 例如它更傾向于把地點定位到某個城市,以及給出的經(jīng)緯度坐標會跟文字描述的地點有偏差。 網(wǎng)友們在實際體驗過后也有類似的感覺。 以至于許多人開始懷疑這個GeoSpy到底是不是憑借所謂的“地理空間視覺大語言模型”技術。 畢竟現(xiàn)在每張照片的背后就會有大量且豐富的信息: 但無論如何,這件事情倒是給我們敲了一個警鐘—— 技術的發(fā)展雖然日新月異,但我們也要時刻警惕數(shù)據(jù)安全的問題;平常一定要注意,不然一不小心就可能被開盒。 體驗鏈接:https://www.geoguessr.com/maps/61902b27f7af9400018aa89d 參考鏈接: [1]https://weibo.com/6444741184/OdDVBnynj#comment [2]https://www.youtube.com/watch?v=FitqxvDuEIY [3]https://www.reddit.com/r/geoguessr/ [4]https://twitter.com/WSXJPDD/status/1786728819446931488 [5]https://twitter.com/gregorycgravett/status/1785894800488583591 文章來源:量子位
|
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選