跳至內容

維基百科:字詞轉換/修復請求

維基百科,自由的百科全書
字詞轉換
主頁 討論
轉換請求
錯誤修復請求
地區詞候選
轉換介紹
字詞轉換處理 討論
  繁簡處理 討論
  地區詞處理 討論
  公共轉換組 討論
幫助文件
繁簡與地區詞處理 討論
  轉換原理 討論
  手動轉換 討論
  進階語法 討論
  用字模式選擇說明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 介面文字轉換
地區用詞 地區詞模板
地區用詞2 進階地區詞模板
各地中文名 地區用詞資訊框
檢視 - 討論 - 編輯 - 變動

本頁面為維基百科:字詞轉換下屬子頁面,用於處理各維基計劃全域轉換和中文維基百科本地全局轉換中的所有繁簡地區詞錯誤轉換修復的請求。

返回字詞轉換主頁 提交錯誤轉換修復新請求

轉換與修復原理

[編輯]

由於簡體中文、繁體中文之間存在一對多現象,即以單一簡化字或繁體字來對應多個繁體字或簡化字[1][2],因此必須有額外的數據來補足原先丟失的資訊。例如,繁體中的「髮」或「發」,在簡體下都是「发」。在程式裏,我們有一個預設的對應,比如說「發」。那麼一般情況下要從簡體轉換成繁體時,程式遇到「发」就會先將其轉換成「發」。那麼什麼時候對應成「髮」呢?這就要看詞庫而定。比如詞庫中有「头发=>頭髮」的關係,這樣「头发」就會被轉換成「頭髮」。如果沒有這一關聯,那「头发」就會被錯誤地轉換成「頭發」。

那詞庫是如何建立的呢?我們先有每個字的預設對應,比如「发」轉換成「發」。然後我們在一個現有的繁體詞庫中尋找包含繁體「發」的詞,再轉換成簡體。這樣得到一個從簡體到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的預設對應關係。同樣,修復過度轉換也是由上述的方法來處理。

外部連結

[編輯]

錯誤轉換修復請求

[編輯]

戴端口镇

[編輯]
狀態:   待修復

請修復大陸簡體模式下錯誤轉換:「戴端口镇」,正確轉換應為「戴埠镇」。出錯頁面:天目湖旅遊度假區。其他說明:僅最新修訂版本更改了分類頁面之後,出現此錯誤--劉振宇留言2025年5月5日 (一) 17:56 (UTC)[回覆]

未見錯誤。--Kethyga留言2025年5月7日 (三) 03:21 (UTC)[回覆]

可穿著

[編輯]
狀態:   待修復

請修復zh-cn模式下錯誤轉換:「可穿著」,正確轉換應為「可穿着」。出錯頁面:跆拳道。其他說明:全局中有可穿著-可穿著的阻止轉換,應該去掉。這裏的「著」基本上不可能是zhù。--Kethyga留言2025年5月7日 (三) 03:19 (UTC)[回覆]

电视系列剧

[編輯]
狀態:   待修復

請修復新加坡、大馬簡體模式下錯誤轉換:「电视系列剧」,正確轉換應為「电视影集」。其他說明:受zh-cn全局轉換表'電視影集' => '电视系列剧'牽連。一則,合成詞素黏着度較低的「電視影集」在新加坡數十倍於合成詞素黏着度較高的「電視系列劇」,「影集」如今在星馬實屬常見,無需轉換;二則,「影集」與星馬港澳慣用的「片集」才是比較接近的概念:「影」與「片」都指膠卷影片(所攝製),二者以往都指洋貨(除在臺灣近年「影集」可指本土製作);三則,中國大陸概念「電視系列劇」與「電視連續劇」等相對,即不包括情節連貫的連續劇,比「影集」意義狹窄,對中國大陸如此轉換亦是曲解;四則,「電視系列劇」在中國大陸傳媒及網站亦越發少見。另外,'電視劇集' => '电视剧'亦不應作用於星馬模式,「劇集」也在中國大陸傳媒及網站常見。--— Gohan 2025年5月12日 (一) 08:59 (UTC)[回覆]

泰坦尼克号

[編輯]
狀態:   待修復

請修復新加坡、大馬簡體模式下錯誤轉換:「泰坦尼克号」,正確轉換應為「泰坦尼克号」。其他說明:受zh-cn全局轉換表'鐵達尼號' => '泰坦尼克号'牽連。僅新加坡報紙簡化字,「铁达尼号」數十倍於「泰坦尼克号」,馬來西亞只會比新加坡更接近港臺用詞。應反其道而行,將「泰坦尼克号」轉換爲「铁达尼号」。— Gohan 2025年5月12日 (一) 09:06 (UTC)[回覆]