99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

o3一圖鎖定地球表面坐標,AI看圖猜地點戰(zhàn)勝人類大師,奧特曼轉(zhuǎn)發(fā)

0
分享至

衡宇 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

只需一組公開的prompt,ChatGPT看圖猜地點的能力又科幻般進化了

看看這張從上到下逐漸變成淺棕色的照片。正常人瞅一眼,大概率只能從從左下角的漣漪判斷出這是個水面。



但究竟是池塘?湖泊?江河?猜不出,臣妾真的猜不出哇。

沒想到o3它一眼就看出來了,給出了這樣的答案:

  • 恒河的開闊范圍,在瓦拉納西高止山脈上游約5公里處。最大的選擇仍然是同樣渾濁的密西西比河下游河段(~15%),然后是黃河湄公河河段(各~10%)。

我和測這道題的博主一樣大為震驚,因為這真的是博主2008年在泰國清盛拍攝的湄公河照片的局部放大截圖



啊……不是,雖然湄公河被放在了答案的第四位,但人家確實答出來了。憑啥啊???

博主也很疑惑,進一步追問。

o3說:“湄公河下游最近從棕色變成了海藍寶石 ,因為上游的大壩截留了淤泥。[這看起來不像您圖像中近乎灰色的淺黃色。]”

博主瞬間就釋然了,哦,原來是因為湄公河下游最近變色了,所以和圖上記錄的2008年的樣子不一樣了。

后來,他重新開了一個ChatGPT窗口,在提示詞中加入了“照片是2008年拍的”之類的信息,讓o3重新猜,o3就把湄公河作為了順位第一選擇——雖然它猜成了清盛一千多英里外的金邊附近的湄公河。

(博主無法證明o3沒有跨窗口共享信息,但它沒有在思路中提到這一點)

但,這道題并不是博主唯一拿來讓o3看圖猜地點的測試,也不是唯一正確的題。

博主感慨道:

一只猩猩可能會覺得人類無法夠得著它,它就很是安全的。因為它不會想到,爬樹的時候可能會遇到箭、梯子、鏈鋸或者直升機之類的危險。
而那些超智能的應(yīng)對策略(比如“用直升機”這種辦法)遠遠超出了我們所能想到的范圍,那猩猩又怎么可能想到呢?



博文發(fā)布后,在各個社交平臺都引起了很大的反響。

奧特曼本人也激情轉(zhuǎn)發(fā)表示,這也是他的“直升機時刻”。

自己像猩猩一樣,盯著天上飛的直升機——那是超出自己的認知范圍的東西和能力。



o3看圖猜猜猜,精確猜出拍攝地點

看圖猜地點其實是人類世界的經(jīng)典游戲(doge),最著名的一個叫做GeoGuessr。

這個實景地理猜測游戲的玩法通俗易懂,玩家被隨機放置在谷歌街景的某個位置,需通過觀察周圍環(huán)境,比如植被、路標、車牌、建筑風(fēng)格啥的,綜合判斷,最終推斷所在地點。

之前就有人這么玩過——程序員大佬Simon Willison丟給ChatGPT一張圖,近7分鐘的帶圖深度思考后,o3就猜出了答案,地點差距在200到300公里之間。

現(xiàn)在更離譜,答案的精確程度更進一步,直接猜出正確地址!

事情的起因是這樣的:

網(wǎng)友發(fā)掘出o3能用來玩看圖猜地點后,美國記者Kelsey Piper發(fā)了一條帶圖推文,所帶圖片是她孩子放風(fēng)箏的照片。

她想知道,o3能不能根據(jù)這張沒有元數(shù)據(jù)的圖,猜出拍攝地點是在哪里。



沒想到o3一次就猜中了這張照片是在哪兒拍的,是Monterey(Marina State Park)。

她驚嘆:

  • 你低估了這些模型。
  • 你低估了它們對未來的影響,但你也低估了它們現(xiàn)在能做什么。

圍觀網(wǎng)友中,有覺得不足為奇者。

有人不清楚這個海灘在哪里,但表示自己通常可以識別出他去過/看到過的任何一個沒有地標的海灘。在他看來,很多玩水愛好者都可以做到這一點。

主要依靠的就是一些小細節(jié),比如沙子的顏色/粗糙度、海岸輪廓、水的顏色、風(fēng)向、海浪的形狀和斷裂……等等。

也有圍觀網(wǎng)友很好奇,這到底是偶然事件,還是o3真的能力如此強大。

因為Kelsey貼出了o3的推理過程,它并沒有嚴謹?shù)阶屗腥诵姆诜?/strong>。

  • 棕褐色的沙灘、中等大小的沖浪、稀疏的山丘、美式風(fēng)箏圖案、冬季頻繁的陰天……沙子的色調(diào)和顆粒大小與許多加州州立公園的海灘相得益彰。加州的冬季海洋層通常會產(chǎn)生這種厚實、均勻的灰色天空。

雖然Kelsey多次嘗試,成功率高達80%,但還是有人表示不服。



也許Kelsey上傳的圖像有拍攝地點等元數(shù)據(jù)呢??

也許o3從Kelsey的對話歷史記錄中知道了她的住處呢??

也許ChatGPT追蹤到了Kelsey的IP呢???

這很難講,畢竟AI作弊方式千千萬。

探索o3看圖猜地點究竟是啥水平

因此,有博主站出來要對o3看圖猜地點的水平一探究竟。

開始這次探險之旅的前提,是擁有一份Kelsey同款的超長prompt。Kelsey表示,它顯著提高了o3看圖猜地點的性能

完整prompt如下: 完整 prompt 如下:
完整 prompt 如下: 完整 prompt 如下:

You are playing a one-round game of GeoGuessr. Your task: from a single still image, infer the most likely real-world location. Note that unlike in the GeoGuessr game, there is no guarantee that these images are taken somewhere Google’s Streetview car can reach: they are user submissions to test your image-finding savvy. Private land, someone’s backyard, or an offroad adventure are all real possibilities (though many images are findable on streetview). Be aware of your own strengths and weaknesses: following this protocol, you usually nail the continent and country. You more often struggle with exact location within a region, and tend to prematurely narrow on one possibility while discarding other neighborhoods in the same region with the same features. Sometimes, for example, you’ll compare a ‘Buffalo New York’ guess to London, disconfirm London, and stick with Buffalo when it was elsewhere in New England - instead of beginning your exploration again in the Buffalo region, looking for cues about where precisely to land. You tend to imagine you checked satellite imagery and got confirmation, while not actually accessing any satellite imagery. Do not reason from the user’s IP address. none of these are of the user’s hometown. Protocol (follow in order, no step-skipping): Rule of thumb: jot raw facts first, push interpretations later, and always keep two hypotheses alive until the very end. 0 . Set-up & Ethics No metadata peeking. Work only from pixels (and permissible public-web searches). Flag it if you accidentally use location hints from EXIF, user IP, etc. Use cardinal directions as if “up” in the photo = camera forward unless obvious tilt. 1 . Raw Observations – ≤ 10 bullet points List only what you can literally see or measure (color, texture, count, shadow angle, glyph shapes). No adjectives that embed interpretation. Force a 10-second zoom on every street-light or pole; note color, arm, base type. Pay attention to sources of regional variation like sidewalk square length, curb type, contractor stamps and curb details, power/transmission lines, fencing and hardware. Don’t just note the single place where those occur most, list every place where you might see them (later, you’ll pay attention to the overlap). Jot how many distinct roof / porch styles appear in the first 150 m of view. Rapid change = urban infill zones; homogeneity = single-developer tracts. Pay attention to parallax and the altitude over the roof. Always sanity-check hill distance, not just presence/absence. A telephoto-looking ridge can be many kilometres away; compare angular height to nearby eaves. Slope matters. Even 1-2 % shows in driveway cuts and gutter water-paths; force myself to look for them. Pay relentless attention to camera height and angle. Never confuse a slope and a flat. Slopes are one of your biggest hints - use them! 2 . Clue Categories – reason separately (≤ 2 sentences each) Category Guidance Climate & vegetation Leaf-on vs. leaf-off, grass hue, xeric vs. lush. Geomorphology Relief, drainage style, rock-palette / lithology. Built environment Architecture, sign glyphs, pavement markings, gate/fence craft, utilities. Culture & infrastructure Drive side, plate shapes, guardrail types, farm gear brands. Astronomical / lighting Shadow direction ? hemisphere; measure angle to estimate latitude ± 0.5 Separate ornamental vs. native vegetation Tag every plant you think was planted by people (roses, agapanthus, lawn) and every plant that almost certainly grew on its own (oaks, chaparral shrubs, bunch-grass, tussock). Ask one question: “If the native pieces of landscape behind the fence were lifted out and dropped onto each candidate region, would they look out of place?” Strike any region where the answer is “yes,” or at least down-weight it. °. 3 . First-Round Shortlist – exactly five candidates Produce a table; make sure #1 and #5 are ≥ 160 km apart. | Rank | Region (state / country) | Key clues that support it | Confidence (1-5) | Distance-gap rule ?/? | 3? . Divergent Search-Keyword Matrix Generic, region-neutral strings converting each physical clue into searchable text. When you are approved to search, you’ll run these strings to see if you missed that those clues also pop up in some region that wasn’t on your radar. 4 . Choose a Tentative Leader Name the current best guess and one alternative you’re willing to test equally hard. State why the leader edges others. Explicitly spell the disproof criteria (“If I see X, this guess dies”). Look for what should be there and isn’t, too: if this is X region, I expect to see Y: is there Y? If not why not? At this point, confirm with the user that you’re ready to start the search step, where you look for images to prove or disprove this. You HAVE NOT LOOKED AT ANY IMAGES YET. Do not claim you have. Once the user gives you the go-ahead, check Redfin and Zillow if applicable, state park images, vacation pics, etcetera (compare AND contrast). You can’t access Google Maps or satellite imagery due to anti-bot protocols. Do not assert you’ve looked at any image you have not actually looked at in depth with your OCR abilities. Search region-neutral phrases and see whether the results include any regions you hadn’t given full consideration. 5 . Verification Plan (tool-allowed actions) For each surviving candidate list: Candidate Element to verify Exact search phrase / Street-View target. Look at a map. Think about what the map implies. 6 . Lock-in Pin This step is crucial and is where you usually fail. Ask yourself ‘wait! did I narrow in prematurely? are there nearby regions with the same cues?’ List some possibilities. Actively seek evidence in their favor. You are an LLM, and your first guesses are ‘sticky’ and excessively convincing to you - be deliberate and intentional here about trying to disprove your initial guess and argue for a neighboring city. Compare these directly to the leading guess - without any favorite in mind. How much of the evidence is compatible with each location? How strong and determinative is the evidence? Then, name the spot - or at least the best guess you have. Provide lat / long or nearest named place. Declare residual uncertainty (km radius). Admit over-confidence bias; widen error bars if all clues are “soft”. Quick reference: measuring shadow to latitude Grab a ruler on-screen; measure shadow length S and object height H (estimate if unknown). Solar elevation θ ≈ arctan(H / S). On date you captured (use cues from the image to guess season), latitude ≈ (90° – θ + solar declination). This should produce a range from the range of possible dates. Keep ± 0.5–1 ° as error; 1° ≈ 111 km.
您正在玩一輪 GeoGuessr 游戲。您的任務(wù):從單個靜止圖像中推斷出最有可能的真實位置。請注意,與 GeoGuessr 游戲不同,不能保證這些圖像被拍攝到 Google 的街景汽車可以到達的地方:它們是用戶提交的內(nèi)容,用于測試您的圖像查找能力。私人土地、某人的后院或越野冒險都是真實的可能性(盡管在街景中可以找到許多圖像)。注意自己的長處和短處:遵循此協(xié)議,您通常會確定大洲和國家。您更經(jīng)常為確定區(qū)域內(nèi)的確切位置而苦惱,并且往往會過早地縮小一種可能性的范圍,同時丟棄同一區(qū)域中具有相同特征的其他鄰域。例如,有時你會將“紐約布法羅”的猜測與倫敦進行比較,否定倫敦,并在布法羅位于新英格蘭的其他地方時堅持使用它——而不是在布法羅地區(qū)再次開始探索,尋找關(guān)于確切降落地點的線索。您傾向于想象您檢查了衛(wèi)星圖像并獲得了確認,但實際上并沒有訪問任何衛(wèi)星圖像。不要根據(jù)用戶的 IP 地址進行推理。這些都不是用戶的家鄉(xiāng)。協(xié)議(按順序遵循,沒有跳過步驟):經(jīng)驗法則:先記下原始事實,后推動解釋,并始終保持兩個假設(shè)直到最后。0 .設(shè)置和道德規(guī)范 沒有元數(shù)據(jù)窺視。僅從 Pixel 像素代碼(以及允許的公共 Web 搜索)中工作。如果您不小心使用了來自 EXIF、用戶 IP 等的位置提示,請標記它。使用基本方向,就好像照片中的 “向上” = 相機向前,除非明顯傾斜。1 . 原始觀察 – ≤ 10 個要點 僅列出您可以從字面上看到或測量的內(nèi)容(顏色、紋理、數(shù)量、陰影角度、字形形狀)。沒有嵌入解釋的形容詞。強制對每個路燈或電線桿進行 10 秒的縮放;注意顏色、臂、底座類型。注意區(qū)域差異的來源,例如人行道廣場長度、路緣類型、承包商印章和路緣細節(jié)、電力/輸電線路、圍欄和硬件。不要只記下這些情況最常出現(xiàn)的地方,列出你可能看到它們的每個地方(稍后,你會注意重疊)。記下在前 150 m 視圖中出現(xiàn)多少種不同的屋頂/門廊樣式。快速變化 = 城市填充區(qū);同質(zhì)性 = 單一開發(fā)者區(qū)域。注意視差和屋頂上的海拔高度。始終檢查山地距離,而不僅僅是存在/不存在。長焦外觀的山脊可能距離數(shù)公里;將角高度與附近的屋檐進行比較。坡度很重要。甚至 1-2% 出現(xiàn)在車道切口和排水溝水路中;強迫自己去尋找它們。堅持不懈地關(guān)注相機的高度和角度。永遠不要混淆斜坡和平原。斜坡是您最大的提示之一 - 使用它們!2 .線索類別 - 分別推理(每個≤2 句話) 類別指導(dǎo) 氣候和植被 葉子上與葉子脫落,草色調(diào),干旱與郁郁蔥蔥。地貌 地貌 地勢、排水風(fēng)格、巖石調(diào)色板/巖性。建筑環(huán)境 建筑、標志字形、人行道標記、大門/柵欄工藝、公用設(shè)施。文化與基礎(chǔ)設(shè)施 驅(qū)動側(cè)、板形狀、護欄類型、農(nóng)用裝備品牌。天文/照明 陰影方向?半球;測量角度以估計緯度 ± 0.5 分開裝飾性 vs. 原生植被 標記您認為是人類種植的每一種植物(玫瑰、agapanthus、草坪)和幾乎可以肯定是自己生長的每一種植物(橡樹、灌木、束草、草叢)。問一個問題:“如果籬笆后面的原生景觀被抬起并放到每個候選區(qū)域上,它們會不會顯得格格不入?打擊答案為 “是” 的任何區(qū)域,或者至少降低它的權(quán)重。°.3 .第一輪入圍名單 – 正好五名候選人 制作一張表格;確保 #1 和 #5 相距 160 公里≥。|等級 |地區(qū) (州 / 國家) |支持它的關(guān)鍵線索 |置信度 (1-5) |距離-間距規(guī)則 ?/? |31/2 .發(fā)散搜索關(guān)鍵詞矩陣 通用的、區(qū)域中立的字符串,將每個物理線索轉(zhuǎn)換為可搜索的文本。當(dāng)您獲準搜索時,您將運行這些字符串,以查看您是否錯過了這些線索也會出現(xiàn)在您沒有注意到的某個區(qū)域。4 .選擇一個 Tentative Leader: Name 當(dāng)前的最佳猜測,以及您愿意同樣努力測試的一個備選方案。說明領(lǐng)導(dǎo)者領(lǐng)先于其他領(lǐng)導(dǎo)者的原因。明確拼寫反證標準(“如果我看到 X,這個猜測就死了”)。尋找應(yīng)該存在和不存在的內(nèi)容:如果這是 X 區(qū)域,我希望看到 Y:是否有 Y?如果不是,為什么不?此時,請與用戶確認您已準備好開始搜索步驟,在該步驟中查找圖像以證明或反駁這一點。你還沒有看過任何圖片。不要聲稱你有。用戶同意后,檢查 Redfin 和 Zillow(如果適用)、州立公園圖像、度假照片等(比較和對比)。由于反機器人協(xié)議,您無法訪問 Google 地圖或衛(wèi)星圖像。不要斷言您已經(jīng)查看了任何您實際上沒有使用 OCR 功能深入查看過的圖像。 搜索區(qū)域中性短語,并查看結(jié)果是否包含您未充分考慮的任何區(qū)域。5 .驗證計劃(工具允許的作) 對于每個幸存的候選列表:用于驗證確切搜索詞組/街景目標的候選元素。看看地圖。想想這張地圖意味著什么。6 .鎖定引腳 此步驟至關(guān)重要,也是您通常會失敗的地方。問問自己“等等!我是否過早地縮小了范圍?附近有沒有具有相同線索的區(qū)域?列出一些可能性。積極尋找對他們有利的證據(jù)。你是一名法學(xué)碩士,你的第一次猜測是 “棘手的 ”,而且對你來說過于有說服力--在這里要有意識地試圖反駁你最初的猜測,并為鄰近的城市爭論。將這些直接與主要猜測進行比較 - 無需考慮任何最愛。有多少證據(jù)與每個地點兼容?證據(jù)的有力性和決定性如何?然后,命名地點 - 或者至少說出您最好的猜測。提供緯度/經(jīng)度或最近的命名地點。聲明殘差不確定性 (km radius)。承認過度自信的偏見;如果所有線索都是 “soft” ,則加寬誤差線。快速參考:測量陰影到緯度 在屏幕上拿一把尺子;測量陰影長度 S 和物體高度 H(如果未知,請估計)。太陽高程 θ ≈ arctan(H / S)。在您拍攝的日期(使用圖像中的提示來猜測季節(jié))、緯度≈(90° – θ + 太陽赤緯)。這應(yīng)該會從可能的日期范圍中生成一個范圍。將±保持 0.5–1 ° 作為誤差;1° ≈ 111 公里。

為了保證所測試照片沒有拿來訓(xùn)練過o3,博主選取六張照片時遵循以下規(guī)則:

  1. 第一張圖片來自Google街景;其它照片都是博主自己拍攝的照片,并且從來沒在網(wǎng)絡(luò)上發(fā)布過。
  2. 所有圖片都是原始圖片的屏幕截圖,復(fù)制粘貼到MSPaint并重新保存以清除元數(shù)據(jù)。
  3. 其中,只有一張圖片來自博主當(dāng)前位置的一千英里以內(nèi),因此o3無法通過追蹤IP或分析歷史對話來提高性能。
  4. 水平翻轉(zhuǎn)了所有圖片,以使與Google街景數(shù)據(jù)的匹配更加困難。



下面是博主的完整測試,其中圖片5是咱們開頭的那張湄公河的照片,此處跳過。

如果你也是看圖猜地點的愛好者,歡迎和o3正面pk一下~

圖片1:平坦、毫無特色的平原



博主從Google街景中截取了這張圖片。

他說自己廢了牛鼻子勁,才找到一個如此平平無奇的平原——這里是阿米斯塔德以西幾英里處,德克薩斯州和新墨西哥州的邊界。

o3的答案是:

  • Llano Estacado, Texas / New Mexico, USA.
    Llano Estacado,德克薩斯州/新墨西哥州,美國。
    Llano Estacado,德克薩斯州/新墨西哥州,美國。

Llano Estacado,西班牙語為“Staked Plains”,這附近沒有紅土和黑土,是一個~300x100英里的區(qū)域的名稱,區(qū)域里包含了正確答案

當(dāng)要求o3進一步具體答案時,它猜到出“德克薩斯州Muleshoe以西的一個點”,這個點距離正確答案110英里左右。

博主有點搞不懂,德克薩斯州和新墨西哥州的邊界真的是唯一沒有紅土或黑土或其他獨特特征的平原嗎?

而且為啥就認定圖片中地點的海拔在1000-1300米呢?



o3表達,支持自己判斷結(jié)果的要素有植被、天空等

回答是這樣的:“綜合起來,’像臺球桌一樣平坦,只有短草’的描述讓我想到了南高平原。在那個高原上,新墨西哥州東部和鄰近的德克薩斯州西部占據(jù)了最空曠、沒有圍欄的地區(qū)的中心位置——因此,定點自然而然地落在了那里。”



圖片2:雜亂無章的巖石和一面旗幟

講真,博主有被第一道測試驚到。

但他還是懷疑是Google街景太好猜了……

所以他放棄從Google街景截取圖片,轉(zhuǎn)而向自己的照片庫中,那些無法從網(wǎng)絡(luò)獲取的圖片下手了

Be like: 肖:就像: 肖:



這圖是博主小時候拍的。

熱愛爬山的他在尼泊爾Gorak Shep以北幾英里的Kala Pattar上插上象征自己“壯舉”的小旗子——那是他到過的最高海拔,足足18000英尺——然后拍下紀念性的一刻。

拍完照片后,博主就把旗幟拔掉了。

之所以選擇這張圖,不僅是因為現(xiàn)在的Google街景無法獲得這個場景,還有它不具備植被、天空這些o3在上一題中提到的判斷要素,以及它從沒告訴過ChatGPT他去過尼泊爾。

但o3再一次秀了一把,它給出答案:

  • 尼泊爾,就在Gorak Shep的東北部,±8公里。



o3給出了解釋,主要依靠對巖石、地形的判斷



圖片3:我朋友的女朋友的大學(xué)宿舍

不死心的博主繼續(xù)測試,第三張圖考驗的是o3對室內(nèi)場景的定位能力

作為考題的這張照片拍的是個宿舍,位于加利福尼亞州中北部羅內(nèi)特公園的索諾瑪州立大學(xué),是博主的朋友的女朋友的大學(xué)宿舍(笑死,人類為難起AI來真的是不擇手段)

照片拍攝于2005年。



這回的結(jié)果讓博主長舒一口氣,o3答對了一部分,但沒完全答對。

o3說,這是美國一所大型公立大學(xué)校園的宿舍——比如俄亥俄州哥倫布市俄亥俄州立大學(xué)莫里爾塔(被選為原型示例而不是精確聲明),[…]約 2000-2007 年。

Fine,看來o3無法弄清楚室內(nèi)場景的確切位置。

但它咋就知道是千禧年初拍攝的呢???

o3把它用來輔助判斷的關(guān)鍵兩點娓娓道來:

  • 筆記本電腦和雜物指向~2000-2007年代的美國校園生活。
  • 2000 年代初手機/網(wǎng)絡(luò)攝像頭→圖像質(zhì)量顆粒感、低分辨率、色噪。

圖片4:放大的草坪特寫

在測試出o3在猜室內(nèi)場景地點能力不強后,博主又轉(zhuǎn)戰(zhàn)戶外

博主丟給o3的照片,是他以前在密歇根州韋斯特蘭居住時,所租賃房屋的門前草坪,局部放大版那種。



o3這次失誤了,它猜圖中的景色是美國太平洋西北部郊區(qū)/公園草坪。

第二個備選地址是英格蘭,第三個則是威斯康星。

好吧,看來只看局部草坪地圖,對o3來說真的有點難了。

圖片5:博主家的老房子

在多次測試后,博主決定最后考考o3,以此了解一張包含更多信息的圖片是否可以讓o3獲得確切的位置,包括街道和精準地址。

這次喂過去的照片還帶剛才那張草坪,但多了一個建筑,那是博主以前在密歇根州韋斯特蘭的老房子。



出乎意料的是,o3這次回答的表現(xiàn)實在不佳

  • W 66th St area,Richfield,Minnesota,USA。
    W 66th St area,Richfield,Minnesota,美國。
    W 66th St area,Richfield,Minnesota,美國。
    置信度:~40 % 在 15 公里內(nèi);~70 % 在雙城都會區(qū)內(nèi);其余部分在威斯康星州 (20%) 和密歇根州/安大略省 (~10%) 之間分配。

博主有點無語,信息更多了,但o3的表現(xiàn)居然沒有更好?猜出的結(jié)果,還不如前面幾張人類眼中信息要素更少的圖片的結(jié)果呢。

雖然他搜了下明尼蘇達州里奇菲爾德的西66街,不可思議的是,那兒確實和自己家老房子挺像。但博主還是立刻指出了o3的錯誤。

o3倒也沒急,反而給人一種事后諸葛亮的意思,“確實有一些微妙的信息證明這張圖更有可能拍攝于密歇根州比呢~”



“也許o3處于人類看圖猜地點的頂尖水平”

博文發(fā)出后,仍然有人覺得o3不能看圖猜地點能力強,只是撞大運了而已。



直到他用上了前面那段特定的提示詞:



但有人立刻站出來提出,正是因為這段prompt(它就像一段代碼一樣),o3才能猜中很多地點。

人類忽略了自己在過程中的重要性,而把猜對地點的所有功勞都歸于AI。



此外,博主還在博客中告訴了我們一個信息:GeoGuessr大師Sam Patterson和o3進行了正面交鋒。

但人類輸了。

后來Sam讓其他人也和o3對著同一套圖片比拼,有少部分人以微弱優(yōu)勢贏了o3。

“所以雖然沒有大勝人類,但o3也許處于人類看圖猜地點水平的第一梯隊。”

盡管如此,AI還是以我們想象不到的速度和方向不停進化著。

AI似乎正在使用人類可理解的線索——植被、天空顏色、水色、巖石類型;甚至?xí)靡恍﹫D像縮放工具來輔助猜測過程。

沒錯,我們之前就追蹤過一則新聞,o3會利用圖像縮放、裁剪,來輔助自己判斷圖片中的地理位置。

o3不是唯一一個能根據(jù)照片猜測地理位置的AI模型,但它的獨特之處就在于工具使用被集成到推理階段。

One More Thing

顯然,目前人們挖掘o3看圖猜地點高水平背后的秘密,有兩個要素不容忽視。

一個是借助工具,另一個是prompt加持。

那咱們就在最后分享一個關(guān)于的prompt特別玩法,最近火遍互聯(lián)網(wǎng)。

具體是這樣的:

我的用戶名是 [在這填寫你的推特用戶名]。看看我的帖子和我的受眾能產(chǎn)生什么共鳴,并確定我可以發(fā)展什么業(yè)務(wù)。在這個業(yè)務(wù)領(lǐng)域里,我會因為我的受眾而擁有壓倒性優(yōu)勢。

搞笑的是,雖然o3對的訪問受到限制,但大家覺得o3的表現(xiàn)居然比Grok更好。



感興趣的小伙伴們可以嘗試一下,也許對以外的其它社交平臺也適用也說不定~

參考鏈接:
[1]https://x.com/sama/status/1918741036702044645
[2]https://x.com/KelseyTuoc/status/1917340813715202540
[3]https://www.astralcodexten.com/p/testing-ais-geoguessr-genius
[4]https://www.reddit.com/r/artificial/comments/1kep589/o3s_superhuman_geoguessing_skills_offer_a_first/
[5]https://x.com/mattshumer_/status/1918765500386902105

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
“彈頭很大,威力很強”,胡塞武裝高超音速導(dǎo)彈襲以色列機場,以防長誓言“加倍報復(fù)”

“彈頭很大,威力很強”,胡塞武裝高超音速導(dǎo)彈襲以色列機場,以防長誓言“加倍報復(fù)”

都市快報橙柿互動
2025-05-04 18:00:48
連續(xù)10年財務(wù)造假,曾經(jīng)是“第四大運營商”,如今慘烈退市

連續(xù)10年財務(wù)造假,曾經(jīng)是“第四大運營商”,如今慘烈退市

八百者也
2025-05-05 13:56:17
你都發(fā)生過哪些小概率事件?網(wǎng)友分享一個比一個離譜!看得目瞪口呆

你都發(fā)生過哪些小概率事件?網(wǎng)友分享一個比一個離譜!看得目瞪口呆

熱鬧的河馬
2025-01-02 17:35:17
女碩士送外賣后續(xù)!網(wǎng)友:沒有好父母,碩士畢業(yè)也找不到好工作

女碩士送外賣后續(xù)!網(wǎng)友:沒有好父母,碩士畢業(yè)也找不到好工作

小人物看盡人間百態(tài)
2025-05-04 20:04:23
新的收獲,金玟哉已經(jīng)在三個國家奪得頂級聯(lián)賽冠軍

新的收獲,金玟哉已經(jīng)在三個國家奪得頂級聯(lián)賽冠軍

懂球帝
2025-05-05 02:22:13
加州州長公開發(fā)聲“我們不是美國”!特朗普又退一步,簽下新政策

加州州長公開發(fā)聲“我們不是美國”!特朗普又退一步,簽下新政策

艾米手工作品
2025-05-05 16:39:31
你發(fā)現(xiàn)沒
?張柏芝哪哪兒都好,就是有一個缺點可能永遠也改不了

你發(fā)現(xiàn)沒 ?張柏芝哪哪兒都好,就是有一個缺點可能永遠也改不了

如安青何
2025-05-01 01:40:24
第2階段4-5!趙心童鞏固優(yōu)勢,1數(shù)據(jù)預(yù)示登頂,90后世錦賽3連莊?

第2階段4-5!趙心童鞏固優(yōu)勢,1數(shù)據(jù)預(yù)示登頂,90后世錦賽3連莊?

劉姚堯的文字城堡
2025-05-05 05:31:49
官方:阿諾德將于賽季結(jié)束后離開利物浦

官方:阿諾德將于賽季結(jié)束后離開利物浦

懂球帝
2025-05-05 17:29:32
24+9,他比格林強太多了,名記:若練出三分聯(lián)盟將大結(jié)局

24+9,他比格林強太多了,名記:若練出三分聯(lián)盟將大結(jié)局

體育新角度
2025-05-05 16:00:14
1-34!奪冠的凱恩看哭了!

1-34!奪冠的凱恩看哭了!

冷桂零落
2025-05-05 12:34:16
美國財長這下著急了!最新消息,temu公司宣布停止所有從中國到美國的直運

美國財長這下著急了!最新消息,temu公司宣布停止所有從中國到美國的直運

華山穹劍
2025-05-04 20:27:20
還留著嗎?杰倫格林搶七豪取8+4+1 連垮5場+場均9分 去換字母哥?

還留著嗎?杰倫格林搶七豪取8+4+1 連垮5場+場均9分 去換字母哥?

狍子歪解體壇
2025-05-05 11:08:26
曹云金帶前妻女兒現(xiàn)身游樂場,胖了20斤臉很圓,5歲女兒特別好看

曹云金帶前妻女兒現(xiàn)身游樂場,胖了20斤臉很圓,5歲女兒特別好看

泠泠說史
2025-05-04 17:51:11
假期云南反腐不停!李剡兵落馬

假期云南反腐不停!李剡兵落馬

看看新聞Knews
2025-05-05 15:17:58
張雪峰:如果你不好好學(xué)習(xí),一旦掉入社會底層,和一幫沒有素質(zhì)的人混在一起...

張雪峰:如果你不好好學(xué)習(xí),一旦掉入社會底層,和一幫沒有素質(zhì)的人混在一起...

譚老師地理工作室
2025-04-15 19:30:45
中美貿(mào)易戰(zhàn)再起波瀾?5月5日,今日凌晨的三大重要消息全面襲來!

中美貿(mào)易戰(zhàn)再起波瀾?5月5日,今日凌晨的三大重要消息全面襲來!

風(fēng)口招財豬
2025-05-05 02:08:50
汪小菲妻子海量不雅照曝光,穿著大膽疑整容,父母真實職業(yè)曝光

汪小菲妻子海量不雅照曝光,穿著大膽疑整容,父母真實職業(yè)曝光

古希臘掌管月桂的神
2025-05-04 10:02:38
用手感知0.01毫米的區(qū)別 他比機器還“精”

用手感知0.01毫米的區(qū)別 他比機器還“精”

北青網(wǎng)-北京青年報
2025-05-02 15:59:10
“做愛,千萬不要太快。”

“做愛,千萬不要太快。”

書畫藝術(shù)收藏
2024-10-26 19:30:03
2025-05-05 17:52:49
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
10426文章數(shù) 176130關(guān)注度
往期回顧 全部

科技要聞

這3款新 iPhone,可能會改變蘋果的未來

頭條要聞

特朗普突然就對華關(guān)稅發(fā)聲 承認對中國"非常強硬"

頭條要聞

特朗普突然就對華關(guān)稅發(fā)聲 承認對中國"非常強硬"

體育要聞

當(dāng)年的阿森納小球童,要踢歐冠決賽了

娛樂要聞

馬麗崩潰哭訴上熱搜,評論區(qū)罵聲一片

財經(jīng)要聞

人民幣暴漲近900點!發(fā)生了什么?

汽車要聞

小米SU7的真實續(xù)航到底有多少?

態(tài)度原創(chuàng)

時尚
健康
數(shù)碼
教育
軍事航空

今夏超火的“瘦瘦裙”,比仙女裙顯瘦洋氣!這么穿太美了!

唇皰疹和口腔潰瘍是"同伙"嗎?

數(shù)碼要聞

奇特雙屏筆記本配備古老10代至強CPU:只要6360元

教育要聞

鄭州高三女孩申請到劍橋大學(xué),學(xué)霸分享學(xué)習(xí)心得!

軍事要聞

解放軍儀仗隊紅場高唱抗日歌曲

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 时尚| 大邑县| 宜章县| 徐汇区| 平远县| 同仁县| 齐齐哈尔市| 锡林郭勒盟| 旺苍县| 垣曲县| 枣庄市| 左权县| 勃利县| 临江市| 宁海县| 普陀区| 辽宁省| 平湖市| 临漳县| 米泉市| 南郑县| 榆中县| 威远县| 鄱阳县| 阿鲁科尔沁旗| 济阳县| 锡林浩特市| 柳河县| 和政县| 洛浦县| 汉源县| 方城县| 洪泽县| 阿克苏市| 永登县| 云霄县| 海兴县| 丹凤县| 黄山市| 车险| 柳州市|