文章轉(zhuǎn)載于Sentrum Okern
作者:Vela
最近,硅谷的AI語(yǔ)音輸入產(chǎn)品Wispr Flow背后公司完成Menlo Ventures 領(lǐng)投的 3000 萬(wàn)美元 A 輪融資。
這是一款讓用戶在任何應(yīng)用內(nèi)都能通過(guò)語(yǔ)音進(jìn)行輸入,支持 104 種語(yǔ)言,并會(huì)根據(jù)不同應(yīng)用場(chǎng)景基于AI能力自動(dòng)調(diào)整語(yǔ)調(diào)和格式的產(chǎn)品。在諸多使用反饋中,用戶對(duì)它評(píng)價(jià)很高。它的絲滑程度,產(chǎn)品設(shè)計(jì)和智能感讓人印象深刻。
今天我們獲權(quán)轉(zhuǎn)載一篇與其創(chuàng)始人 Tanay Kothari 的對(duì)話,作者Vela為在硅谷的語(yǔ)音產(chǎn)品創(chuàng)業(yè)者。
如果說(shuō)硅谷最近有什么產(chǎn)品能真正給大家?guī)?lái)那種珍貴的 aha moment,語(yǔ)音輸入產(chǎn)品 Wispr Flow 就是其中之一。這個(gè)產(chǎn)品是我認(rèn)為第一個(gè)能讓用戶真正感受到語(yǔ)音作為輸入界面,產(chǎn)生 aha momen 的產(chǎn)品。尤其是最近看到很多朋友體驗(yàn)后都表示,不用打字之后,能通過(guò)自然語(yǔ)言像和人交流一樣的方式輸入,那種爽感是真實(shí)的。
今年二月我和創(chuàng)始人 Tanay Kothari 交流,發(fā)現(xiàn)他其實(shí)對(duì)語(yǔ)音交互和產(chǎn)品設(shè)計(jì)有很深的思考,會(huì)從神經(jīng)科學(xué)和設(shè)計(jì)哲學(xué)的角度去探索更深層的"為什么"。在那次對(duì)話之后我也很佩服他,在硅谷這么多技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè)公司里,像他這樣既懂技術(shù)又真正關(guān)注用戶體驗(yàn)、有產(chǎn)品 sense 的創(chuàng)始人并不多。
作為同樣在語(yǔ)音賽道的創(chuàng)業(yè)者,我個(gè)人覺(jué)得從硅谷這邊來(lái)看,語(yǔ)音 AI 還處于技術(shù)創(chuàng)新的非常早期階段。它就像重寫所有的 APP 一樣,會(huì)在交互輸入層面重塑現(xiàn)在大多數(shù)產(chǎn)品的體驗(yàn)。目前語(yǔ)音 AI 整體創(chuàng)業(yè)的進(jìn)展是先從基礎(chǔ)設(shè)施層出發(fā),比如 speech-to-text、real-time voice conversation 這些,然后再進(jìn)入到應(yīng)用層的產(chǎn)品。
然而,語(yǔ)音這種輸入界面的方式對(duì)于人們使用產(chǎn)品的習(xí)慣影響是慢慢滲透的,在應(yīng)用產(chǎn)品層正在逐漸出現(xiàn)聚焦各種細(xì)分賽道的語(yǔ)音應(yīng)用。從 OpenAI 的 Advanced Voice Mode 讓我們第一次體驗(yàn)到真正的 AI 對(duì)話,到 Google 的 NotebookLM 用雙人播客重新定義信息消費(fèi),再到語(yǔ)音輸入的 Wispr Flow、情感陪伴的 Tolan、會(huì)議記錄的 Granola 等產(chǎn)品在不同場(chǎng)景的探索——語(yǔ)音正在成為一個(gè)穩(wěn)定的接口,擴(kuò)寬人們與產(chǎn)品交互的物理邊界。
前幾周,Wispr Flow 宣布完成了 Menlo Ventures 領(lǐng)投的 3000 萬(wàn)美元 A 輪融資,這篇文章分享一下我和 Tanay 聊的一些觀點(diǎn),以及關(guān)于語(yǔ)音產(chǎn)品設(shè)計(jì)的思考。
1
一、Wispr Flow:比打字快 4 倍的語(yǔ)音輸入
Wispr Flow 是一款語(yǔ)音轉(zhuǎn)文字應(yīng)用,核心功能是讓用戶在任何應(yīng)用內(nèi)都能通過(guò)語(yǔ)音進(jìn)行輸入。不管你是在寫郵件、發(fā) Slack 消息、寫文檔,還是和 ChatGPT 對(duì)話,都可以用說(shuō)話代替打字。產(chǎn)品支持 104 種語(yǔ)言,并且會(huì)根據(jù)不同應(yīng)用場(chǎng)景自動(dòng)調(diào)整語(yǔ)調(diào)和格式。
團(tuán)隊(duì)背景
創(chuàng)始人 Tanay Kothari 擁有斯坦福大學(xué)計(jì)算機(jī)科學(xué)學(xué)士學(xué)位,曾在 Andrew Ng 指導(dǎo)下進(jìn)行 AI 研究。9 歲開(kāi)始編程,20 歲時(shí)創(chuàng)立的第一家公司 FeatherX 在一年內(nèi)被收購(gòu)。
聯(lián)合創(chuàng)始人兼 CTO Sahaj Garg 同樣來(lái)自斯坦福,曾在 Google Brain 進(jìn)行 NLP 和機(jī)器學(xué)習(xí)公平性研究,在 Luminous Computing 擔(dān)任 AI 團(tuán)隊(duì)負(fù)責(zé)人。
產(chǎn)品發(fā)展時(shí)間線
Wispr AI 成立于 2021 年 8 月,最初想做通過(guò)識(shí)別無(wú)聲口型來(lái)打字的可穿戴設(shè)備。
- 2023 年轉(zhuǎn)向軟件,開(kāi)發(fā) Wispr Flow 應(yīng)用
- 2024 年 10 月發(fā)布 Mac 版本
- 2025 年 3 月推出 Windows 版本
- 2025 年 6 月發(fā)布 iOS 應(yīng)用并在 Product Hunt 獲得第一名
目前產(chǎn)品的用戶增長(zhǎng)率達(dá)到月環(huán)比 50%,收入增長(zhǎng)月環(huán)比 60%,付費(fèi)轉(zhuǎn)化率 19%,年收入 380 萬(wàn)美元。據(jù) Tanay 透露,硅谷幾乎每一家一線風(fēng)投基金都在使用 Wispr Flow 處理郵件、備忘錄和文檔,"他們感到被這個(gè)產(chǎn)品吸引住了,這是他們每天都在使用的產(chǎn)品之一",我自己也是產(chǎn)品的日活用戶。
有體驗(yàn)過(guò)的朋友會(huì)更認(rèn)可這一點(diǎn),語(yǔ)音輸入一旦進(jìn)入的 flow 其實(shí)很難再回到打字狀態(tài),這也是為什么我自己和身邊做語(yǔ)音產(chǎn)品的朋友一直也越來(lái)越相信“語(yǔ)音作為一種新的產(chǎn)品交互媒介”的原因。
1
二、對(duì)話 Tanay:深入 Voice AI 的設(shè)計(jì)哲學(xué)
二月份我與 Tanay 進(jìn)行了一次深度對(duì)話,那次交流印象極深,不僅僅是 Wispr Flow 這一產(chǎn)品的設(shè)計(jì)理念和技術(shù)實(shí)現(xiàn),還有很多是彼此同作為語(yǔ)音產(chǎn)品的早期探索者,對(duì)于 Voice Interface 語(yǔ)音界面這一全新交互方式的一些思考和共鳴。以下是對(duì)話的核心內(nèi)容:
Vela: Why is the product called "Flow"?
Tanay: The name "Flow" captures the essence of the product's design philosophy—enabling users to enter a natural, uninterrupted rhythm while speaking, listening, and completing tasks. The interface avoids distractions and cognitive overload, allowing users to focus entirely on their interactions without being interrupted by unnecessary visual or technical elements.
Vela:為什么產(chǎn)品叫"Flow"?
Tanay:"Flow"這個(gè)名字體現(xiàn)了產(chǎn)品設(shè)計(jì)理念的精髓——讓用戶在說(shuō)話、聽(tīng)取和完成任務(wù)時(shí)進(jìn)入一種自然、不中斷的節(jié)奏。界面避免干擾和認(rèn)知過(guò)載,使用戶能夠?qū)W⒂诨?dòng),而不被不必要的視覺(jué)或技術(shù)元素打斷。
一些思考:
這里體現(xiàn)的是心理學(xué)家 Mihály Csíkszentmihályi 的"心流"理論在產(chǎn)品設(shè)計(jì)中的具體應(yīng)用。在我自己構(gòu)建語(yǔ)音產(chǎn)品的過(guò)程中,我深刻體會(huì)到"Flow"狀態(tài)對(duì)用戶體驗(yàn)的重要性。用戶在使用語(yǔ)音輸入時(shí),任何界面上的干擾都會(huì)打斷思維的連貫性。
這一設(shè)計(jì)理念讓我想起了之前分析過(guò)的 Suno 的產(chǎn)品哲學(xué)——技術(shù)的最高境界是讓用戶感受不到技術(shù)的存在。當(dāng)我們?cè)谠O(shè)計(jì)語(yǔ)音界面時(shí),如何在提供必要反饋的同時(shí)不打斷用戶的思維流,這是一個(gè)需要精心平衡的設(shè)計(jì)挑戰(zhàn)。
Vela: What is the goal of the voice interface?
Tanay: The voice interface is designed to become an indispensable tool in users' lives by replacing traditional devices like phones and laptops for 90% of daily tasks. The ultimate goal is to build a product that users trust and rely on, with seamless usability, personalization, and natural interactions as its core features. The long-term vision involves creating a dedicated hardware device that integrates the voice interface into users' lives, allowing them to perform tasks like communication, task management, and information retrieval effortlessly through voice commands. This vision emphasizes the shift from screen-based to voice-first interactions, making technology more intuitive and accessible.
Vela:為什么做語(yǔ)音界面?
Tanay:語(yǔ)音界面旨在成為用戶生活中不可或缺的工具,通過(guò)替代傳統(tǒng)設(shè)備(如手機(jī)和筆記本電腦)完成 90% 的日常任務(wù)。最終目標(biāo)是打造一個(gè)用戶可以信任和依賴的產(chǎn)品,其核心功能包括無(wú)縫的可用性、個(gè)性化和自然的交互。長(zhǎng)期愿景是創(chuàng)建一個(gè)專用的硬件設(shè)備,將語(yǔ)音界面無(wú)縫集成到用戶的生活中,使他們能夠通過(guò)語(yǔ)音命令輕松完成通信、任務(wù)管理和信息檢索等任務(wù)。從基于屏幕的交互轉(zhuǎn)向語(yǔ)音優(yōu)先的交互,讓技術(shù)更加直觀和易用。
一些思考:
在中提到過(guò),我認(rèn)為語(yǔ)音正在成為一個(gè)較穩(wěn)定的接口擴(kuò)寬人們與產(chǎn)品交互的物理邊界,而 Tanay 提到的"替代 90% 日常任務(wù)"不是簡(jiǎn)單的功能替換,而是交互方式的重新定義。
語(yǔ)音交互的最大價(jià)值在于它解放了用戶的手和眼睛,讓多任務(wù)處理成為可能。但要實(shí)現(xiàn)這個(gè)愿景,關(guān)鍵在于如何處理語(yǔ)音交互中的錯(cuò)誤和模糊性,比如在人們?nèi)粘Uf(shuō)話中有很多話是沒(méi)有必要的,但又有一些很重要(nuance),所以如果作為一種從聽(tīng)寫的交互看,不必要逐字逐句聽(tīng)寫,但又要弄明白用戶意圖、什么是重要的?——這正是 Wispr Flow 通過(guò)"零編輯"這一目標(biāo)要解決的核心問(wèn)題。
Vela: When talking about voice interface design, all of us are pretty new to this field. What is the product design philosophy when building the flow?
Tanay: The product is designed with a user-first, emotion-based philosophy, emphasizing how interactions make users feel rather than focusing solely on technical performance.
- Emotion-Based Design: The design aims to elicit positive emotions and reduce frustration, creating a delightful and intuitive user experience.
- User-Centric Focus: Moving away from overly technical, developer-oriented designs to prioritize the needs and behaviors of end-users.
- Flow-Oriented Interface: The product ensures a seamless, uninterrupted experience by aligning with how users naturally interact with technology.
For example: - Avoiding real-time text display during speech to reduce cognitive interference (based on neuroscience research). - Displaying text during pauses to help users process information more effectively. - Learning from user corrections to build a personalized dictionary and continuously improve accuracy.
Vela:產(chǎn)品的設(shè)計(jì)理念是什么?
Tanay:用戶優(yōu)先、基于情感,強(qiáng)調(diào)互動(dòng)如何讓用戶感到愉悅,而不僅僅關(guān)注技術(shù)性能。
基于情感的設(shè)計(jì):設(shè)計(jì)旨在激發(fā)積極情緒,減少挫敗感,創(chuàng)造令人愉悅且直觀的用戶體驗(yàn)。
以用戶為中心:摒棄過(guò)于技術(shù)化、面向開(kāi)發(fā)者的設(shè)計(jì),優(yōu)先考慮最終用戶的需求和行為。
Flow 流暢界面:產(chǎn)品通過(guò)與用戶自然的技術(shù)互動(dòng)方式相一致,確保無(wú)縫、不中斷的體驗(yàn)。例如:
- 避免在語(yǔ)音過(guò)程中實(shí)時(shí)顯示文本,以減少認(rèn)知干擾(基于神經(jīng)科學(xué)研究)。
- 在暫停時(shí)顯示文本,幫助用戶更有效地處理信息。
- 從用戶的糾正中學(xué)習(xí),建立個(gè)性化詞典并不斷提高準(zhǔn)確性。
一些思考:
"情感優(yōu)先設(shè)計(jì)哲學(xué)"這一點(diǎn)值得思考。在我自己構(gòu)建語(yǔ)音產(chǎn)品的過(guò)程中,我發(fā)現(xiàn)技術(shù)指標(biāo)和用戶體驗(yàn)之間往往存在微妙的平衡。傳統(tǒng)的語(yǔ)音識(shí)別產(chǎn)品過(guò)分關(guān)注 WER(詞錯(cuò)誤率),但用戶真正在意的是能否"零編輯"地使用輸出結(jié)果。
就像當(dāng)時(shí)分析 時(shí)發(fā)現(xiàn)的一個(gè)重要洞察:最好的 AI 產(chǎn)品不是炫耀技術(shù),而是讓技術(shù)消失在用戶體驗(yàn)中。Wispr Flow 通過(guò)基于神經(jīng)科學(xué)的界面時(shí)序設(shè)計(jì),體現(xiàn)了對(duì)用戶認(rèn)知過(guò)程的深度理解——這正是我認(rèn)為語(yǔ)音產(chǎn)品與傳統(tǒng) GUI 產(chǎn)品最大的差異。
Vela: What neuroscience insight influenced the design?
Tanay: Neuroscience research revealed that speaking and reading activate the same brain region responsible for language understanding. This overlap makes it challenging for users to do both simultaneously. To address this, the product avoids displaying real-time text during speech, reducing cognitive interference. Instead, text appears during pauses, aligning with how the brain processes language and allowing users to reflect on their output more effectively.
Vela:神經(jīng)科學(xué)的哪些見(jiàn)解影響了設(shè)計(jì)?
Tanay:神經(jīng)科學(xué)研究表明,說(shuō)話和閱讀會(huì)激活同一個(gè)負(fù)責(zé)語(yǔ)言理解的大腦區(qū)域。這種重疊使用戶難以同時(shí)完成兩項(xiàng)任務(wù)。為了解決這一問(wèn)題,產(chǎn)品在語(yǔ)音過(guò)程中避免顯示實(shí)時(shí)文本,從而減少認(rèn)知干擾。相反,文本在暫停時(shí)顯示,與大腦處理語(yǔ)言的方式保持一致,使用戶能夠更有效地反思輸出內(nèi)容。
一些思考:
一個(gè)啟發(fā)點(diǎn),在設(shè)計(jì)語(yǔ)音界面時(shí),我們往往本能地想要提供實(shí)時(shí)反饋,比如其他的同類語(yǔ)音輸入產(chǎn)品 Aqua、Superwhisper 是這樣做的,但 Tanay 提到的這一點(diǎn)值得我們?cè)谠O(shè)計(jì)產(chǎn)品時(shí)從用戶體驗(yàn)而不是技術(shù)角度出發(fā)來(lái)思考問(wèn)題。
認(rèn)知負(fù)載理論將人腦處理信息的負(fù)荷分為三類:內(nèi)在負(fù)載(任務(wù)本身的復(fù)雜性)、外在負(fù)載(呈現(xiàn)方式造成的額外負(fù)荷)、以及有效負(fù)載(促進(jìn)學(xué)習(xí)和理解的負(fù)荷)。從認(rèn)知負(fù)載的角度來(lái)看,Wispr Flow 通過(guò)將復(fù)雜的 AI 處理過(guò)程完全后臺(tái)化來(lái)優(yōu)化內(nèi)在負(fù)載,通過(guò)精心設(shè)計(jì)的界面時(shí)序來(lái)消除外在負(fù)載,通過(guò)個(gè)性化學(xué)習(xí)來(lái)增強(qiáng)有效負(fù)載。
Vela: How does personalization work in the product?
Tanay: Personalization is a cornerstone of the product, achieved through advanced modeling that adapts to each user's unique preferences, behaviors, and communication styles. Key elements include:
- Tone and Style Adaptation: The system learns how users communicate in different contexts (e.g., casual with friends, formal with colleagues, warm with family) and adjusts the tone, language, and structure of responses accordingly.
- Emoji and Phrase Integration: It incorporates contextual elements like emojis or specific phrases that align with the user's habits, making interactions feel more natural and human-like.
- Continuous Learning: The system learns from user corrections (e.g., adjusting transcriptions or adding new words to the dictionary) to refine its performance over time.
- Multi-Language Support: Personalization extends across languages, ensuring consistency in tone and style when users switch languages.
This level of personalization ensures the product feels intuitive, tailored, and responsive to each individual's needs.
Vela:Wispr Flow 是怎么做語(yǔ)音輸入的“個(gè)性化的”?
Tanay:個(gè)性化是產(chǎn)品的基石,通過(guò)高級(jí)建模實(shí)現(xiàn),能夠適應(yīng)每位用戶的獨(dú)特偏好、行為和溝通風(fēng)格。關(guān)鍵要素包括:
語(yǔ)氣和風(fēng)格調(diào)整:系統(tǒng)會(huì)學(xué)習(xí)用戶在不同情境下的溝通方式(例如,與朋友的隨意交流、與同事的正式溝通、與家人的溫暖交流),并相應(yīng)地調(diào)整語(yǔ)氣、語(yǔ)言和回復(fù)結(jié)構(gòu)。
表情符號(hào)和短語(yǔ)集成:它會(huì)根據(jù)用戶習(xí)慣集成上下文元素,如表情符號(hào)或特定短語(yǔ),使互動(dòng)更自然、更人性化。
持續(xù)學(xué)習(xí):系統(tǒng)從用戶的糾正中學(xué)習(xí)(例如,調(diào)整轉(zhuǎn)錄或添加新詞到詞典),隨著時(shí)間推移不斷優(yōu)化性能。
多語(yǔ)言支持:個(gè)性化功能擴(kuò)展到多種語(yǔ)言,確保用戶在切換語(yǔ)言時(shí)語(yǔ)氣和風(fēng)格的一致性。
個(gè)性化機(jī)制其實(shí)正是 AI 產(chǎn)品的”護(hù)城河“,關(guān)鍵在于是否有足夠有效的用戶信息。
Vela: What is the roadmap for flow in terms of voice interface?
Tanay:
1. Perfect Speech-to-Text Functionality: Establishing a highly accurate, reliable foundation for real-time transcription and speech recognition.
2. Personalization and User-Specific Models: Building sophisticated models that adapt to individual users' preferences, communication styles, and unique vocabularies.
3. Actions and Workflow Capabilities: Introducing features like smart reminders, email/message automation, and workflow integration to enhance productivity and convenience.
4. Dedicated Hardware Device: The long-term vision includes creating a wearable device that replaces 90% of phone and laptop usage, allowing users to perform most tasks seamlessly through voice commands.
Vela:怎么看 Flow 發(fā)展的產(chǎn)品路線圖?
Tanay:
1. 完善語(yǔ)音轉(zhuǎn)文字功能:建立一個(gè)高度準(zhǔn)確且可靠的實(shí)時(shí)轉(zhuǎn)錄和語(yǔ)音識(shí)別基礎(chǔ)。
2. 個(gè)性化和用戶特定模型:構(gòu)建復(fù)雜的模型,能夠適應(yīng)每位用戶的偏好、溝通風(fēng)格和獨(dú)特詞匯。
3. 動(dòng)作和工作流功能:引入智能提醒、電子郵件/消息自動(dòng)化和工作流集成功能,提升生產(chǎn)力和便利性。
4. 專用硬件設(shè)備:長(zhǎng)期愿景包括創(chuàng)建一個(gè)可穿戴設(shè)備,替代 90% 的手機(jī)和筆記本電腦使用,通過(guò)語(yǔ)音命令無(wú)縫完成大部分任務(wù)。
一些思考:
先在軟件層面做到極致,再考慮硬件承載,其實(shí)這一路線比他們一開(kāi)始直接做硬件以及很多做語(yǔ)音硬件產(chǎn)品更為現(xiàn)實(shí)。
而 Tanay 提到的第三階段提到的"動(dòng)作和工作流功能",是語(yǔ)音產(chǎn)品區(qū)別于傳統(tǒng)輸入工具的關(guān)鍵——從被動(dòng)的轉(zhuǎn)錄變成主動(dòng)的行動(dòng)助理。就像Granola,不僅僅是一個(gè)會(huì)議聽(tīng)寫記筆記工具,它還會(huì)在會(huì)議開(kāi)始前提醒你將要到來(lái)的回會(huì)議,并在會(huì)議結(jié)束后為你撰寫一封必要的郵件。
Get things done.
同時(shí),值得一提的是,在新功能正式發(fā)布前, Flow 團(tuán)隊(duì)首先會(huì)在內(nèi)部進(jìn)行大量的 Beta 測(cè)試。這使團(tuán)隊(duì)能夠觀察實(shí)際使用情況,識(shí)別問(wèn)題,并根據(jù)反饋對(duì)功能進(jìn)行優(yōu)化,然后再發(fā)布給外部用戶。確保新功能以用戶為中心、可靠且經(jīng)過(guò)完善。
1
三、寫在最后,關(guān)于 AI 產(chǎn)品設(shè)計(jì)
從 Wispr Flow 可以很好地看出一個(gè)關(guān)注產(chǎn)品本身、且具有”產(chǎn)品Sense“的一個(gè) AI 產(chǎn)品是怎樣被創(chuàng)造出來(lái)的。而對(duì)于 Voice AI Interface 這一全新的交互,對(duì)于所有創(chuàng)業(yè)者來(lái)說(shuō)都是一種全新的體驗(yàn)的探索。創(chuàng)造 Voice Interface 的思考可以遷移到對(duì) Voice AI 的構(gòu)建中:
第一,用戶體驗(yàn)重于技術(shù)指標(biāo)。 傳統(tǒng)的語(yǔ)音識(shí)別產(chǎn)品追求準(zhǔn)確率,但 Wispr Flow 追求的是"零編輯"的用戶體驗(yàn)。這個(gè)差異看似微小,實(shí)則代表了完全不同的產(chǎn)品哲學(xué)。
核心是從用戶角度出發(fā),什么是你希望帶給用戶的一種好的用戶體驗(yàn)?很多第一次體驗(yàn)語(yǔ)音輸入的朋友都表示,“啊不用打字只需要blabla且不用擔(dān)心說(shuō)廢話真爽”,就像很多第一次體驗(yàn)會(huì)議記錄產(chǎn)品 Granola 的用戶說(shuō) “啊,不用再擔(dān)心錄音、丟掉會(huì)議信息的感覺(jué)真爽”“而自己只需要記錄自己覺(jué)得核心的東西,其他的事情交給 Granola 很放心”。
第二,相信科學(xué),忠于用戶。Wispr Flow 語(yǔ)音輸入背后是基于神經(jīng)科學(xué)研究:人在說(shuō)話時(shí)大腦是怎么運(yùn)作的?我們是否可以同時(shí)說(shuō)話、傾聽(tīng)、記筆記?然而,優(yōu)秀的產(chǎn)品也同樣極其關(guān)注用戶,關(guān)注產(chǎn)品背后真實(shí)的人與用戶故事。
第三,個(gè)性化(Personization)是 AI 產(chǎn)品的核心競(jìng)爭(zhēng)力。 在人人都可以用大模型捏一個(gè)產(chǎn)品的時(shí)代,真正的護(hù)城河不在于模型本身,而在于對(duì)用戶的深度理解、用戶知識(shí)沉淀和個(gè)性化能力。
我很喜歡 Flow 這款產(chǎn)品,很欣賞 Tanay,就像自己剛來(lái)硅谷和 Suno 交流一樣,Tanay 也 像極了 Suno 的創(chuàng)始人 Mikey,他們有著及其相似的 vibe, 一樣的對(duì)做創(chuàng)造產(chǎn)品的熱忱、和對(duì)于產(chǎn)品設(shè)計(jì)近乎極致的追求。
在語(yǔ)音 AI 逐漸發(fā)展的今天,Wispr Flow 的出現(xiàn)給大家?guī)?lái)的 Voice-First 體驗(yàn)的 Aha moment。正如我在之前的文章中提到的,"語(yǔ)音正在成為一個(gè)較穩(wěn)定的接口擴(kuò)寬人們與產(chǎn)品交互的物理邊界"。
我相信我們正站在一個(gè)重要的歷史節(jié)點(diǎn)。Voice-first 不僅僅是一種技術(shù)趨勢(shì),更是一種重新定義人機(jī)交互與重塑的機(jī)會(huì)。
對(duì)于 Voice- AI,其實(shí)一切都才剛剛開(kāi)始。
黎明破曉,我們都在路上。
Pride Month at Ferry Building, SF, June 28th
Wispr Flow 產(chǎn)品體驗(yàn)(免費(fèi)適用)
https://wisprflow.ai/
點(diǎn)個(gè)愛(ài)心,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.