整理 | 申莉琦
采訪、編輯 | 王與桐
【資料圖】
ChatGPT無疑是2023年截至目前的關鍵詞。而如我們所知,ChatGPT令人驚艷的AI能力,不僅僅體現在“回答”,更體現在“生成”。
“生成”能力,也是目前國內企業競相追求的下一代AI發展方向。而秘塔寫作貓,就已經進化出了“生成”文章的能力。
成立于2018年的秘塔科技,最早是在法律賽道做翻譯,后來逐漸深入寫作場景,成為國產版本Grammarly。
而秘塔寫作貓顯然并不滿足于此。在去年秋天,秘塔寫作貓推出了“量子速寫”這一文章生成器,很快就獲得了廣泛的關注,一周時間內達到上萬的日活。
今年以來,整個ChatGPT領域不斷有新聞發生,GPT-3.5-turbo的API開放、GPT4上線、百度文心一言上線等等。我們采訪了秘塔寫作貓創始人&CEO閔可銳,一起聊聊了從Grammarly到ChatGPT,下一個時代的文章工具,應該是什么樣。
以下是專訪實錄,經36氪整理:
36氪:按我個人的理解是:ChatGPT由生成式對話與搜索資料這兩部分功能組成,在您看來,這兩部分中哪一個是讓ChatGPT火起來最重要的原因?
閔可銳:在一定程度上來說ChatGPT的爆火不只是需求上的原因。對于對話式交互領域,學術界一直在發展革新,但對于普通的民眾來說,并沒有感知。以前在大家印象中能達到30分-40分用戶體驗的功能短時間提升到了80分-90分,讓很多人都感到震驚,造成廣泛的自傳播。實際上,在去年9月份我們推出小程序速寫時,也讓很多人感到驚喜。
36氪:我最早接觸你們,是因為你們的文本糾錯能力;去年年底你們又推出了智能寫作的功能;但據我們所知,秘塔最早涉足的是法律翻譯相關的領域。作為秘塔寫作貓的CEO,您能分享一下您創業的歷程,以及秘塔科技寫作貓的發展迭代邏輯嗎?
閔可銳:一直以來我從事的都是研發相關的工作,早在2013年時我創立過另一家公司做自然語言處理,在B端有一定的影響力。2018年起,我們開始了秘塔這個項目。在秘塔剛創立的時候,我們就已經料想到新一代以深度學習為代表的技術,能達到準專業級腦力勞動上的效果,就像現在大家都在討論的ChatGPT。可能在此之前大家對人工智能的理解還停留在小愛同學的級別,你發出的一些比較標準的指令能夠得到滿足,但只要超出這個的范疇,它就束手無策。而現在ChatGPT的出現相當于給全民做了一個AI能力的普及。
18年起,我們就在朝這個方向努力,選擇了法律這個領域切入,因為這個領域本身就具備付費的意愿與能力。在做跨國交易的時候,律師可能需要花費兩三周的時間進行翻譯與校對的工作,這就體現了human intelligence能夠被替代的單點,且有意愿付費。就算在較好的律所里配有專職的翻譯團隊,單價卻非常昂貴。這就促成了我們第一個產品落地的定位,就是把翻譯這件事做好。
19年我們發布了第一個翻譯產品,當時還在北大法學院舉辦了相關活動,通過邀請資深的律師和公司法務觀摩不同學校代表隊與AI進行PK,讓大家直觀地感受到了目前機器的翻譯能力已經達到一個專業的水平。隨后基本上國內頂級的幾百家律所也陸續成為了我們的客戶。
為了使用機器幫助減少重復性腦力勞動的工作量并提高工作的效率,我們在2020年的時候推出了糾錯校對的產品。對于一些白領來說,跟大量的文本打交道是不可避免的,無奈的是,市面上并沒有一個好的產品去幫助他們進行一些糾錯潤色或者校對提示。傳統的Word也達不到上述的要求。
36氪:我使用中文時,出現錯別字、語法問題,從未被Word提示。
閔可銳:Word在十幾年前集成了這一套基礎的語法檢查體系,對于英文還行,但在中文這種語法不那么規則化的語言面前是很難施展的,由于中文語法本身的高度模糊性,導致市面上一直沒有比較流行且靠譜的產品,這恰恰是新一代技術可以施展拳腳的地方。基于我們對形勢的判斷,三年前我們發布了我們第一個版本的寫作貓,很大程度上減輕了文字工作者的苦惱。
近兩年,我們也逐步加入了針對英文的檢查與改寫潤色。在整個過程中,我們也意識到了很多用戶的價值感知最高的,不是幫助他找出文章的錯誤,而是幫助他從0到1生成文章,或給他一些ideas與靈感上的啟發。
36氪:那是怎么想到做文章續寫、智能寫作這方面的事情呢?
閔可銳:我們起初做糾錯這個產品時,在海外對標的是09年成立的Grammarly公司,它花了大概十余年的時間讓營收達到了小一億美金的級別。
而AI應用公司——Jasper——利用新技術作為杠桿,加上自身對營銷的理解,在創立短短的兩年時間里就達到了接近一億美金的規模,可見AI的價值。
學術上證明了GPT可行性后,Jasper公司又在商業上證明了這件事的可行性。
因為我們自身有相關技術儲備,在去年下半年推出了一個叫量子速寫的小程序:哪怕你只輸入一個標題,我們也能給你生成2000字并具有完整邏輯的文章。事實證明反響還不錯,也驗證了AI寫作的直接需求。
量子速寫的生成文字
量子速寫的生成文字
后續我們也在不斷進行優化與模型迭代,去年11月份時,寫作貓正式從“你來寫我來改”的模式變成了一個更一體化AI寫作平臺。
營銷宣傳的團隊,在使用寫作貓之前,人工一天可能寫出上千字,而使用寫作貓后,客戶只需要定義好需要的描述或賣點,我們就可以為我們的客戶生成一批相關的文案,就算客戶后續再手動地進行修改與調整,速度上也會比原先單純使用人工去完成任務更快。
現在看來,去年國內市場還是比較安靜的。相比較之下,海外從2021年起便涌現一系列創業公司借助OpenAI的API開放應用層產品。
36氪:不久前有很多人提到ChatGPT會取代Grammarly,您對此有什么想法嗎?從邏輯上來說是可行的,但ChatGPT這樣更好的生成式技術,用于檢查語法、錯字,是不是相當于用牛刀殺雞呢?
閔可銳:如果這把牛刀足夠便宜,殺雞也是可行的。和小模型相比,就算大模型的成本上存在幾十倍的差異,這些差異最終在客戶端都被抹平。
我在團隊內部里也提到,如果一個工具能提升20%-30%的效率,那么它可以被定義為一個良好的工具;如果它能提升高達30倍的效率,這時大概率會遇到倫理問題。
Grammarly目前的定位與追求是輔助者,而不是幫助用戶直接生成文章,畢竟大幅提升效率的新產品難免會和傳統價值觀產生一定的沖突。這也是Grammarly沒有選擇快速轉型的原因。但是,當人們發現一件事10秒就能完成時,便不愿再花費10分鐘去完成。在現在這個時代,一旦潘多拉魔盒被開啟,就很難再把它裝回去。
36氪:所以您也是會認同Grammarly會被取代這種觀點?
閔可銳:這還要取決于他們自己的營銷策略,畢竟目前為止他們還擁有一個比較廣泛的應用群體。但如果Grammarly只專注于幫助用戶檢查錯誤,會受到具有更綜合功能產品的挑戰。
36氪:目前AI對話、AI寫作領域的實踐模式,大多是搜索加語料庫的路徑,你們調用的路徑是與ChatGPT不一致的嗎?你們使用的數據又是從何而來的呢?
閔可銳:我們從2018年成立,產品所用到的模型均為自研。在前GPT3時代,生成式的內容很不靠譜,會有各式各樣低級的錯誤。在大模型基礎上,我們進行一系列良好的訓練與工程的優化后,寫作貓長文生成質量達到了實用級別。對于數據方面,我們使用的都是全網各種新聞網頁或其他公開資料洗出來的高質量數據。
36氪:我們之前試用過mini max公司的旗下產品glow,發現其對話風格與近年來流行的劇本殺風格類似,那么它們的數據來源又是什么呢?
閔可銳:網絡小說。在中國有著極其豐富的網絡小說資源,這個量級在全球范圍內都首屈一指。中國目前網絡小說存量加起來比OpenAI訓練GPT3的數據還要多。
36氪:前段時間,OpenAI宣布開放ChatGPT的API接口,對于這件事您怎么看?
閔可銳:在我看來,它的商業推進速度是非常之快。并且這套定價體系的出現,會讓很多全球范圍內跟OpenAI處于一定競爭關系、使用類似商業模式的公司感到十分難受這也是OpenAI在12個月里第二次降價, 總計下調到了1/30,這給所有其他想要利用大模型并提供上層API調用的公司而言無疑是巨大的壓力。且不論你的模型無法與之相比,在定價時,它采取的甚至不是以獲取正向利潤為目的定價策略。
36氪:這種策略與中國互聯網滴滴美團這些公司十分類似。
閔可銳:這其實是一個非常激進地去普及其API的方式,在一定程度上來說,這個方式可能也是行之有效的。微軟投入的巨額資金,其中的大部分也會在自己平臺上重新被使用,所以也算是收入的一部分,或者更通俗來說,可以看成是一種優惠券,換來的可能是市場上絕對優勢的壟斷地位,這就讓其他公司很難再通過類似的模式賺取利潤。
36氪:正如您之前所說,ChatGPT開放API接口會讓很多公司難受,但主要提及的是海外與其采用類似商業模式的公司。您認為對于一些國內相關領域的公司,他們難受的點在哪里呢?
閔可銳:我認為,我們國內是需要自主自研的可控大模型的。但單從商業角度來說,我很難想象國內的公司和它在市場上進行價格上的競爭。
我自己原來也在Google和微軟等公司實習,很多時候大公司從研發到推出產品的流程需要以年來計時。我們已經很多年沒有見到像微軟這樣體量的企業,每周都會對其主產品線做更新,并把它的技術提升應用到它核心的產品線,包括Bing的搜索上。
36氪:目前ChatGPT大模型的API已經可以調用,在價格還比較低廉的情況下,秘塔寫作貓會考慮接入嗎?
閔可銳:我個人的觀點是,如果我們現在面臨的是30門全科能力的考試,OpenAI確實有機會通過它的規模與算力在綜合性的30門考試中取得比我們更好的成績。而我們的優勢在于我們直面用戶,解決特定剛需場景問題,在我們重點關注的領域做到比它們好。
36氪:那我可以理解你們團隊是對標的Jasper而不是OpenAI嗎?
閔可銳:就目前來說,我們不愿意提所謂對標OpenAI這類邏輯。在一個月內,有太多公司從資本市場冒出并公開表明對標OpenAI。我們保持敬畏。
36氪:我會傾向于把你們類比成中國版的Jasper,如果中國版的ChatGPT,也就是百度的文心一言成功上線,對你們公司會產生沖擊嗎?
閔可銳:首先,我們也很期待在這個節點上百度推出的產品展示技術能力;如果百度希望做成中國版的ChatGPT,那與我們其實不會產生直接沖擊。我們希望我們的產品更貼合專業且具體的場景,而ChatGPT更像是一個好的技術而不是一個收費的工具。
36氪:目前有很多投資人認為Jasper是一個很好的標的,那么 Jasper這種模式在中國國內是可以復制的嗎?
閔可銳:我們目前所看到的情況是,在國內不論你針對什么環境,與國際市場的付費意愿相比而言是糟糕的,但不可否認偏營銷端的產品相對來說更好。很多公司并不愿意為單純具備管理職能的軟件每年支付上萬元,可如果某產品能為公司帶來可量化的1萬新增用戶,那公司就很有可能為其買單。他們可以選擇使用較小的金額去驗證產品帶來的效果,當發現效果不錯以后,他們也會相應地投入更多的金額。
36氪:了解了你們在應用層面與OpenAI有較大差別以后,我想知道如果在投資到位的情況下,你們會選擇去擴張團隊的規模,在底層技術去追趕它們;還是會選擇把更多的精力放在實際應用這個方面呢?
閔可銳:底層技術是我們一定會去不斷投入的方向,但對于是否需要千億模型這件事,我們的態度是不一定。
36氪:那您認為最有決定效果的方面是什么呢?
閔可銳:我們之所以認為OpenAI很強的重要原因是在它達到85分效果需要完成的這100件事里,每一件事它都沒有短板。我們會去探索更高的參數量,評估其必要性千億模型對成本來說是一個負擔,在接近的應用效果方面,我們會希望它越小越好,而不是越大越好,因為后者會帶來更大的成本。
就像Facebook最近也在訓練一些較小的模型并利用它們達到千億級別的效果。所以理論上可以在更小的規模上達到2020年GPT3版本的訓練效果, GPT-3的1700億參數訓練并未充分。
36氪:未來ChatGPT的API廣泛應用于中國市場的話,你認為會不會涌現出很多做相同事情的廠商?
閔可銳:我相信這是不可避免的。從2020年起,市場上就有大量試圖模仿我們的產品,雖然效果有顯著差異。
無論是國內還是國外,競爭是常態。但凡是有價值的領域,就會有很多公司參與競爭。
36氪:您作為公司的CEO,在新的一年里對公司有什么具體的規劃嗎?或者換另一種說法,當你們今年只能做好一件事時,您希望公司更看重商業化還是技術,或者其他別的選項?
閔可銳:我們始終會考慮把商業化和技術兩件事捆綁在一起完成,希望我們在生成能力這項技術上的投入能直接反哺到客戶數量的增長,提升客戶的滿意度與復購的意愿,然后我們才能有更大的資源讓客戶了解到我們,這是一個正向循環的過程。驗證大家是否認可你最簡單的方式就是用錢投票。
關鍵詞: