AI1-自然語言處理（NLP）模型

用途：理解並生成自然語言對話，提供即時互動與資訊檢索。

應用場景：
- 客服聊天機器人：自動回答用戶問題（如 GPT-4 驅動的企業客服系統）。
- 個人助理：Siri、Alexa 等語音助手（整合 Whisper 語音辨識）。
- 教育輔導：解答學科問題或提供學習建議（如 Khanmigo）。
代表模型：
- ChatGPT（OpenAI）：通用對話模型，支援複雜推理。
- Claude 3（Anthropic）：強調安全性和長上下文理解。

用途：根據提示生成連貫且符合語境的文字內容。

應用場景：
- 內容創作：撰寫文章、行銷文案、劇本（如 Jasper.ai）。
- 程式碼生成：自動生成或補全程式碼（如 GitHub Copilot）。
- 創意寫作：詩歌、小說情節構思（如 Sudowrite）。
代表模型：
- GPT-4：擅長開放式文本生成與多輪對話。
- Command R（Cohere）：針對企業檢索增強生成（RAG）優化。

用途：跨語言轉換與多語言內容理解。

應用場景：
- 即時翻譯：文件、網頁、會議口譯（如 DeepL）。
- 本地化服務：適應文化差異的廣告文案改寫。
- 少數語言保護：瀕危語言的數位化保存與翻譯。
代表模型：
- Google Translate（基於 PaLM 2 的多語言能力）。
- NLLB（Meta）：支援 200+ 種語言的開源翻譯模型。

用途：從長文本中提取關鍵資訊，生成簡明摘要。

應用場景：
- 新聞摘要：快速瀏覽每日重點（如 ChatGPT 的摘要插件）。
- 法律文件：合約條款精簡與風險提示。
- 學術研究：論文核心結論提取（如 Scite.ai）。
代表技術：
- BART（Meta）：專注於摘要任務的序列到序列模型。
- Pegasus（Google）：預訓練目標直接針對摘要生成。

用途：分析文本中的情緒傾向（正面、負面、中立）。

應用場景：
- 品牌監控：社交媒體用戶評論情緒追蹤（如 Brandwatch）。
- 市場調研：消費者對新產品的反饋分析。
- 心理健康：從日記或對話中檢測抑鬱傾向（如 Woebot）。
代表模型：
- RoBERTa：經大量數據微調後的情感分類模型。
- VADER（規則庫+機器學習）：適用於社交媒體短文本。

用途：從非結構化文本中提取實體、關係與事件。

應用場景：
- 知識圖譜構建：從維基百科提取人物、地點、事件（如 Wikidata）。
- 金融合規：從新聞中提取企業併購事件與風險信號。
- 醫療記錄：從病歷中提取診斷結果與用藥記錄。
代表技術：
- spaCy：開源的實體識別與依存句法分析工具。
- ERNIE（百度）：融合知識圖譜的預訓練模型。

用途：理解用戶查詢意圖，提供精準結果或個性化推薦。

應用場景：
- 電商搜索：根據模糊描述匹配商品（如「適合海邊的印花連衣裙」）。
- 內容推薦：YouTube 影片推薦、Spotify 歌單生成。
- 企業知識庫：員工快速檢索內部文件（如 Elasticsearch 結合 NLP）。
代表模型：
- BERT（Google）：革新搜尋引擎的語意理解能力。
- DPR（Dense Passage Retrieval）：針對檢索任務優化的雙塔模型。

用途：處理領域專用文本，輔助決策與分析。

應用場景：
- 合約審查：自動標註風險條款（如 Lexion）。
- 財報分析：從年報中提取關鍵財務指標（如 AlphaSense）。
- 合規監管：掃描金融交易記錄中的可疑活動。
代表模型：
- ChatLaw（中國）：法律問答與文件分析工具。
- BloombergGPT：專注金融數據的領域模型。

用途：整合文本、圖像、語音等模態進行聯合推理。

應用場景：
- 圖文問答：回答關於圖片的問題（如 GPT-4V）。
- 影片內容分析：自動生成影片字幕與摘要（如 Whisper + CLIP）。
- 跨模態檢索：用文字搜索圖片或影片片段。
代表模型：
- Flamingo（DeepMind）：處理圖文交互的少樣本學習模型。
- KOSMOS-2（Microsoft）：理解圖像中的空間關係。

NLP 技術已滲透至 搜索引擎、社交媒體、企業 SaaS、物聯網設備 等場景，未來將更聚焦 個人化、即時性、可信度 三大方向，同時面臨 資料隱私、能源消耗、技術濫用 等關鍵挑戰。