自從 ChatGPT 發布以來,大多數人在網上閱讀任何內容時都會想到一個問題:“這是人寫的還是人工智能寫的?” ChatGPT 無疑是一個開拓者,產生了看起來非常像人類的多樣化內容。但這些模型的複雜性提出了一個我們在 AI 開發早期沒有預料到的問題。

我們將如何區分 AI 編寫的文本和人類編寫的文本?畢竟,每個人都有權知道他們正在閱讀的是人類編寫的內容還是機器噴出的內容。這個問題的道德問題在學術和政治環境中成為一個更加緊迫的問題。

因此,不用說,如果我們要辨別一段內容的來源,那麼它是極其重要的。防止嚴重濫用該技術。在本指南中,我們將學習如何做到這一點。

Originality.AI

可用於檢測 AI 編寫的內容的方法之一是使用另一個基於人工智能的工具。一些流行的工具包括:

Originality.AI ——該工具更適合希望確保不在其網站上發布任何內容的專業內容創作者最終會被谷歌的人工智能內容檢測算法標記。它是一款付費工具,還提供團隊管理等功能。GPTZero – 這款 AI 內容檢測工具主要為教育工作者設計,使用困惑度和突發性分數來檢測內容AI寫的。它非常擅長它的工作,它甚至可以在由 AI 編寫的文本中找到單獨的句子。HuggingFace GPT-2 輸出檢測器 – 這個名字可能有點囉嗦,建議該工具已經過時(提示 GPT-2),但它對使用 GPT-3.5 生成的文本也能出奇地好用。GLTR(巨型語言模型測試室) –該工具基於一個簡單的原則檢測 AI 編寫的內容,即 AI 生成的文本是預測性的,而不是隨機的。 GLTR 判斷每個單詞在給定其左側上下文的情況下預測它的可能性有多大。如果你有一段很容易預測的文本,那麼你就有一段 AI 寫的文本。簡單。Content at Scale 的 AI 檢測器– 來自生成式 AI 工具的另一個可靠的內容檢測器,可以幫助您免費檢測 AI 生成的內容。作者的AI Content Detector – 另一個免費的 AI Content Detector 工具,可以比較準確地檢測 AI 編寫的內容。使用免費版本,您一次最多可以掃描 1500 個單詞。OpenAI 的 AI 文本分類器 – 來自 OpenAI 的 AI 內容檢測工具,ChatGPT 本身就是背後的公司。雖然它仍需要進一步開發以提供準確的檢測,但它可以幫助您檢測由 ChatGPT 攪動的內容。CopyLeaks 的 AI 內容檢測器 – 剽竊檢測工具 CopyLeaks 還提供其網站上的 AI 檢測工具,目前處於測試階段,可免費使用。當您想通過 AI 檢測內容時,可以考慮使用一個很好的工具。Kazan SEO – 另一個免費工具,提供可靠的 AI 檢測工具以及許多其他功能,例如 SEO 優化,查找集群關鍵字等。

您可以在我們單獨的指南中的以下鏈接中找到對每個工具的更詳細評論。

最佳 AI 內容檢測器工具

最佳工具現在可以準確檢測人工智能編寫的內容,甚至是使用 ChatGPT 生成的內容。

內容檢測工具是否足夠?

內容檢測工具適用於現在,但事實是,他們正在努力跟上人工智能發展的瘋狂速度。一個恰當的例子:這些工具仍在努力檢測來自 GPT-3.5 模型的文本,而 GPT-4 已經出現。這就像一場比賽,內容檢測工具似乎正在輸。更不用說眾所周知,通過進行稀疏編輯就可以輕鬆繞過其中的大多數。而且,如果您要獲取一個 AI 生成的文本並使用另一個 AI 對其進行解釋,則可能無法使用這些工具進行檢測。

此外,大多數這些工具都需要更長的文本才能可靠地運行。其中一些甚至對分析所需的字符數有最低限制。這使得在較小的文本(例如電子郵件)中更難發現機器書寫。

這也是一個事實,即一種內容檢測工具有時無法檢測來自另一種工具的內容,因為這需要訪問有關 AI 的一些信息公司不提供的模型。例如,考慮 OpenAI。他們正在為由他們的模型開發的文本開發水印技術,例如 GPT-3 Watermark 為文本添加了一種不引人注意的模式,不會以任何方式影響最終用戶,但對於內容檢測工具來說卻很明顯,文本來自 GPT-3。但是帶水印的數據將只保留在 OpenAI 中,使他們自己的工具更容易只檢測數據。

簡而言之,雖然這些工具很有用,但並非萬無一失。那麼,還有什麼選擇呢?我很高興你問。你需要學會辨別標誌!

標誌 AI 寫的內容

有一些明顯的標誌,你可以訓練自己看對於由 AI 工具編寫的內容。如果不有意識地訓練自己,你就不會有太多機會,因為這就是這些工具的危險所在。所以,是時候係好安全帶了!

關於這些模型的事實是,它們通過預測句子中最有可能出現的下一個單詞來工作,並且並不真正了解它們在說什麼。由於它是一個基於預測的模型,所以一些模式比比皆是。

重複的毛茸茸的文章

AI 編寫的大部分內容讀起來都像毛茸茸的文章,就像有人在重複單詞和想法以滿足字數。您還應該掃描文本以了解其閱讀的流利程度;如果你覺得文本不流暢,重複某些單詞和短語,那很可能是人工智能寫的。

據研究人員說,經常出現重複的常用詞,比如“the ”、“它”和“是”等,比人類編寫的文本中的數量還要多。因為他們預測的是最有可能的詞,所以文本以這樣的詞結束,而不是不常見的詞。但在整篇文章中,同樣的詞語和表達方式也重複了一個想法。這導致內容變得有些乏味。

過度使用的短語

您還會在機器生成的文本中發現大量陳詞濫調和通用語言。這是它們成為預測模型的結果之一。諸如“但是有很多好處”、“你有沒有想過..?”等短語用機器書寫填滿了頁面。

尋找拼寫錯誤

AI模型的一個特點就是不會出現拼寫錯誤。因此,如果您在文本中看到拼寫錯誤,可以安全地假設該文本是由人類編寫的。

不尋常的句子結構

AI 生成的文本可能有句子不尋常或不遵循典型語法規則的結構。它們表面上看起來不錯,但仔細觀察會發現一些微妙的線索,表明書寫不自然。

人類創造力缺失的有機元素

無論使用 AI 的生產力和效率優勢如何,事實是,如果沒有人為乾預,這些機器學習網絡往往會產生感覺相當僵硬和不自然的內容。您還能期待什麼?這是一台機器;它以提供信息的方式提供書面信息,通常以第二人稱或第三人稱的聲音提供。從來沒有第一人稱的聲音,任何個人風格或故事,因為怎麼可能呢?此外,所使用的語音類型始終保持一致。它永遠不會轉換成另一種聲音,因為機器不會像人類那樣違反書寫規則。

它也缺少只有自然書寫才能擁有的核心。沒有情感或個性。

沒有有機聯繫的想法

您可能經常會遇到看似不加任何序言地從一個想法跳到下一個想法。這些亂七八糟的想法會擾亂你的大腦,試圖保持穩定的把握,這是 AI 寫作的特徵。換句話說,人工智能可能難以保持連貫性和遵循清晰的敘述或論點。

不使用隱喻;但是當它們被使用時,它們會感到被強迫

AI 產生的寫作往往是樸素和平淡的,沒有使用隱喻或其他文學手段。而在其他時候,這些隱喻會被強行插入他們覺得不自然的地方。矛盾的是,它有時甚至會使用您很少聽到的不自然的語言。

訓練自己在寫作中發現這些模式可能很困難。但是有一種更有趣的訓練方式;你可以玩遊戲。 Google Brain 的高級研究科學家 Daphne Ippolito 開發了這樣一款遊戲。該遊戲包括猜測人類寫作的終點和計算機生成的句子的起點。她發現人們在玩遊戲時逐漸更善於發現 AI 寫作。

雖然上面提到的事情會有幫助,但事實是我們都在這裡的未知領域。隨著 AI 技術的發展和成熟,區分真實和 AI 變得越來越困難。

Categories: IT Info