Home

Home
Nắng thì cày ruộng, mưa thì đọc sách 晴耕雨讀

23/08/2017

Cần thanh toán cái lầm lạc của thuyết "Chữ Hán là văn tự ưu việt" (bản dịch Nguyễn Hải Hoành)

Cụ Nguyễn Hải Hoành vẫn miệt mài dịch những bài thú vị từ tiếng Trung ra tiếng Việt. Nể phục sức làm việc của cụ. Lần này là bản dịch một bài phân tích về sự lầm lạc của thuyết "Chữ Hán là văn tự ưu việt" (nguyên bản tiếng Trung đã lên mạng từ 11 năm trước, tức năm 2006).

Luận bàn này có liên quan tới một bài mà tôi đã phát biểu vào mùa hè năm ngoái (có thể tạm xem lại ở đây hoặc ở đây).

Phía chủ trương "Chữ Hán là văn tự ưu việt" cũng đưa rất nhiều luận cứ khó mà bắt bẻ được. Đặc biệt, những người đứng ở tuyến đầu của thuyết này lại không phải là người Trung Quốc. Họ là người Nhật Bản, phương Tây, Việt Nam,...Ở Việt Nam, thì rõ nhất là nhà ngôn ngữ học Cao Xuân Hạo.

Từ đây trở xuống là bản dịch tiếng Việt của Nguyễn Hải Hoành.

Dưới cùng là nguyên bản tiếng Trung Quốc.





---



  •   MỄ A LUÂN [1]
  • Chủ nhật, 20 Tháng 8 2017 11:11
  • font size giảm kích thước chữ tăng kích thước chữ
Đã nhiều năm nay thuyết “chữ Hán ưu việt” rất thịnh hành ở Trung Quốc (TQ). Thuyết này trái ngược nghiêm trọng với các nguyên lý khoa học kỹ thuật, gây ra sự ngộ nhận cực lớn trong xã hội, cũng gây ra trở ngại cực lớn cho sự phát triển khoa học công nghệ (KHCN) thông tin Trung văn. Muốn tự chủ phát triển sáng tạo các công nghệ cốt lõi và giành lấy quyền chủ động chiến lược phát triển KHCN thông tin Trung văn, TQ cần phải tiến hành dọn sạch các sai lầm của thuyết “chữ Hán ưu việt”.
I. Thuyết “Chữ Hán ưu việt” bắt đầu tràn ngập đại lục TQ từ năm 1989. Quan điểm phổ biến nhất hồi đó là: Trong các văn kiện của Liên Hợp Quốc, những tệp [file] văn kiện in chữ Hán có độ dầy nhỏ nhất, cho nên chữ Hán ưu việt hơn các loại ngôn ngữ như Anh văn v.v…Vì người cổ súy cho thuyết « Chữ Hán ưu việt”từng làm công tác phiên dịch tại trụ sở LHQ nên quan điểm đó đã làm nhiều người nhầm lẫn [2].
Ta đều biết, khi tiến hành bất kỳ sự so sánh nào phải có một tiền đề tối thiểu : điều kiện và phương thức phải như nhau. Thế nhưng cách viết tiếng Anh và cách viết chữ Hán là hai phương thức có điều kiện khác nhau : tiếng Anh dùng cách viết nối liền một dòng đơn [đơn tuyến] các ký tự chữ cái, còn chữ Hán dùng cách vẽ các nét bộ thủ trên bình diện. Nếu các nét bộ thủ ấy cũng dùng cách viết liền các ký tự trên một dòng thì độ dài của dòng cần thiết cho một chữ Hán thường là lớn hơn dòng viết chữ cái tiếng Anh. Nếu các từ tiếng Anh cũng dùng cách vẽ trên bình diện thì không gian bình diện cần vẽ chẳng khác mấy so với chữ Hán.
Xin nêu một ví dụ : “中国人Trung Quốc nhân” [người TQ], Trung văn dùng 3 ký hiệu chữ Hán, còn Anh văn “CHINESE” dùng 7 ký tự không thể chia cắt nhau viết liền một dòng. Nhưng nếu chữ Hán cũng dùng các ký tự không thể chia cắt viết theo cách viết liền một dòng, thí dụ các nét bộ thủ viết liền nhau, thì sẽ có 14 ký hiệu “sổ (nét thẳng đứng), triết (nét gập), hoành (nét ngang), sổ ... ”, nối nhau trên chiều dài lớn hơn nhiều so với dãy chữ Anh. Có thể vì thế mà nói rằng văn bản in bằng chữ Hán sẽ mỏng hơn in bằng tiếng Anh, từ đó nói Hán ngữ “ưu việt” hơn Anh ngữ chăng ? Dĩ nhiên là không.
Như vậy, quan điểm nói “Trong các văn kiện của Liên Hợp Quốc, những tệp văn kiện in chữ Hán có độ dầy nhỏ nhất, cho nên chữ Hán ưu việt hơn các loại ngôn ngữ như Anh văn... ” là quan điểm hoàn toàn không có chút thường thức tối thiểu về so sánh, phân tích ; sự so sánh như thế là không có ý nghĩa gì hết.
II. Những người cổ súy thuyết “chữ Hán ưu việt” nói :vì chữ Hán có lượng thông tin bình quân [平均信息量, Average information content] lớn, cho nên chữ Hán ưu việt hơn tiếng Anh.
Đây là cách nói theo kiểu đoán mò.
Nguyên lý cơ bản của khoa học thông tin cho thấy : lượng thông tin bình quân của hệ thống ký hiệu mà dữ liệu sử dụng càng lớn thì tính bất ổn định và phí tổn [nguyên văn : tiêu hao] của hệ thống đó càng lớn, là yếu tố bất lợi cho việc quản lý và truyền thông tin. Ví dụ Entropy thông tin bình quân [平均信息熵] của Anh văn vào khoảng 4,03 bit, của chữ Hán khoảng 9,6 bit, tức lượng thông tin bình quân của chữ Hán lớn hơn nhiều so với của ký hiệu Anh văn. Khi làm cùng một tác nghiệp dữ liệu thì hệ thống ký hiệu chữ Hán có phí tổn tổng thể lớn nhất, vì vậy lượng thông tin lớn của chữ Hán chính là yếu tố bất lợi. Nếu lượng thông tin bình quân lớn mà có thể đổi lấy độ chính xác tinh vi bình quân cao hơn (ví dụ tính tin cậy và tránh được sự đa nghĩa...) thì có lẽ cũng đáng giá. Nhưng theo sự khảo sát phân tích của các chuyên gia TQ và nước ngoài thì độ dư thừa bình quân [平均多余度, Average redundancy] của các hệ ký tự chữ Hán và Anh văn lại suýt soát như nhau, cũng tức là nói, lượng thông tin bình quân lớn của chữ Hán không mang lại độ chính xác tinh vi cao hơn, cũng chẳng mang lại hiệu quả thực tế tăng được tính tin cậy và tránh được sự đa nghĩa. Muốn đạt được độ chính xác tinh vi và tính tin cậy đại để như nhau thì hệ ký hiệu chữ Hán lại có phí tổn cao hơn rất nhiều so với hệ ký hiệu Anh văn. Như vậy có thể nói chữ Hán “ưu việt” hơn tiếng Anh được chăng ?
Quan niệm cứ thấy “lớn” thì cho là tốt đã chiếm lĩnh đầu óc của nhiều người, bởi vậy khi thấy nói “chữ Hán có lượng thông tin bình quân lớn”, người ta bèn đoán mò nghĩ rằng điều đó thật là “ưu việt” xiết bao. Họ đâu có biết rằng đấy chính là yếu tố bất lợi cho việc quản lý và truyền dữ liệu. Lấy “chữ Hán có lượng thông tin bình quân lớn” làm lý do cho quan điểm “chữ Hán ưu việt” là việc làm đi ngược lại nguyên lý khoa học và tri thức cơ bản của lý thuyết thông tin.
III. Những người cổ súy thuyết “chữ Hán ưu việt” nói :trong thao tác máy tính, thao tác đưa chữ Hán vào máy tính nhanh hơn tiếng Anh, chỉ gõ vài phím là trên màn hình đã xuất hiện cả một cụm từ hoặc câu ngắn, trong khi tiếng Anh thì phải gõ từng chữ cái, vì thế chữ Hán “ưu việt” hơn tiếng Anh.
Đây là cách nói thiếu hiểu biết về máy tính.
Ai hiểu nguyên lý đưa vào lấy ra từ máy tính đều biết rằng mối quan hệ giữa cách hiển thị ký tự và việc thao tác bàn phím hoàn toàn là quy định của trình tự do con người làm ra. Ví dụ có trình tự quy định : Zhongguo = “中国(Trung Quốc)”, ren =  “人(người)”; zgr = Zhongguo + ren. Như vậy khi liên tục gõ “zgr” thì sẽ hiển thị ba chữ Hán “中国人”. Cũng theo phương pháp đó, người ta soạn một trình tự đưa vào lấy ra theo cách gõ các ký tự “Shakespeare_12” sẽ hiển thị toàn bộ tác phẩm “Đêm thứ 12” gồm mấy trăm nghìn ký tự tiếng Anh. Như vậy có thể nói đưa tiếng Anh vào máy tính nhanh hơn tiếng TQ, do đó nói hệ thống chữ viết Anh văn “ưu việt” hơn hệ thống văn tự chữ Hán được không ? Rõ ràng là không.
Thao tác máy tính tiếng Anh phổ biến dùng phương pháp đưa vào từng chữ cái, nhằm để việc quản lý toàn diện dữ liệu tiếng Anh có một tiêu chuẩn thống nhất, nhằm đạt được hiệu quả giá thành tốt hơn, chứ không phải là do nhân viên làm công tác quản lý dữ liệu máy tính tiếng Anh không biết gì về thiết kế trình tự đơn giản quy định cụm từ, câu ngắn như thế nào, lại càng không phải vì tiếng Anh có “hơn kém” gì so với các ký hiệu văn tự khác.
IV. Thuyết “chữ Hán ưu việt” còn có một phát biểu nữa :“Vì chữ Hán có đặc điểm tượng hình, biểu ý nên nó đặc biệt thích hợp dùng cho khoa học kỹ thuật hiện đại, là thứ ngôn ngữ máy tính lý tưởng.”
Nói như thế là không đúng sự thật, cũng không hợp với nguyên lý làm việc của máy tính.
Từ ngày công nghệ máy tính Trung văn bắt đầu phát triển, thời gian dùng cho việc làm ra phương pháp đưa chữ Hán vào máy tính đã tốn mất hơn 30 năm, kinh phí và nhân lực bỏ ra lại càng không thể tính toán được. Thế nhưng cho tới nay do kho dữ liệu chữ Hán vẫn không đủ dùng, việc đăng ký hộ khẩu tại cơ quan công an, việc đăng ký chủ tài khoản ngân hàng từng nhiều lần xảy ra trục trặc khó xử ; vấn đề truyền và xử lý dữ liệu Trung văn xảy ra loạn mã cho đến nay cũng chưa hoàn toàn giải quyết xong. Kho dữ liệu chữ Hán hiện có dùng 2 bites [nhị tự tiết] ; muốn bao gồm tất cả các chữ Hán thì tất phải dùng 4 bites [tứ tự tiết] [3], khi đó chẳng nói cũng biết là giá thành sẽ cao và hiệu suất sẽ thấp. Điều đáng chú ý nữa là cứ cho rằng đã hoàn tất việc xây dựng kho dữ liệu chữ Hán đi nữa, thì cũng không thể đáp ứng nhu cầu quản lý toàn diện dữ liệu Trung văn. Mọi việc vẫn cứ  phải làm lại từ đầu. Trước những sự thật đó, sao mà có thể nói “chữ Hán đặc biệt thích hợp dùng cho KHKT hiện đại” và là “thứ ngôn ngữ máy tính lý tưởng hơn” ?
Cái gọi là “ngôn ngữ máy tính” vừa không phải là Anh văn lại cũng chẳng phải là Trung văn hoặc ký hiệu văn tự nào khác loài người đang sử dụng. Nó là ngôn ngữ hệ nhị phân do “0” và “1” họp thành, tức “ngôn ngữ máy”. Cho dù dữ liệu thuộc chủng loại hình vẽ, âm thanh hay chữ viết, việc xử lý máy tính của chúng đều được hoàn thành bởi thao tác đóng mở công tắc chế độ nhị phân, hoàn toàn không có quan hệ gì với việc ký hiệu văn tự nó sử dụng là tượng hình, biểu ý và với cách viết thư pháp của nó. Nếu ký hiệu chữ Hán là “ngôn ngữ máy tính lý tưởng hơn” hệ nhị phân, thế thì tại sao trên thế giới chưa có một máy tính nào (kể cả máy tính TQ sử dụng) bỏ hệ nhị phân, sử dụng hệ ký hiệu chữ Hán để thiết kế chế tạo ?
V. Từ lâu Chính phủ TQ đã công bố Phương án Pinyin Hán ngữ hiện đại [Scheme for Chinese phonetic alphabet] và các quy phạm tiêu chuẩn ngôn ngữ văn tự như Chính từ pháp [正词法, orthography, phép chính tả; ở đây là Phép chính tả của Pinyin Hán ngữ]... cùng các quy phạm tiêu chuẩn quốc tế được các tổ chức quốc tế chính thức như Liên Hợp Quốc tiếp nhận sử dụng trên toàn cầu.
Thế nhưng những người cố súy thuyết “chữ Hán ưu việt” lại nói các quy phạm tiêu chuẩn đó là “tả khuynh” và “mù quáng phương Tây hóa” ; họ chủ trương trở về “Chú âm chữ Hán (Hán tự chú âm汉字注音) ” cách nay ngót trăm năm [4]. Do sự dẫn dắt sai lầm nghiêm trọng của thuyết “chữ Hán ưu việt”, hiện nay hầu hết tài liệu Trung văn và nhiều tài liệu chữ viết phát hành trong, ngoài TQ đều dùng phương pháp “Chú âm chữ Hán”, đem lại hậu quả tiêu cực nghiêm trọng cho công tác quản lý dữ liệu Trung văn.
Ví dụ câu “Bắc Kinh là thủ đô TQ”, theo phương thức viết pinyin Hán ngữ hiện đại của quy phạm tiêu chuẩn quốc gia, câu này viết là : “Beijing shi Zhongguo de shoudu”. Nhưng phương thức viết “Chú âm chữ Hán” do thuyết “chữ Hán ưu việt” chủ trương lại viết : “bei jing shi zhong guo de shou du”. Đến khi xử lý dữ liệu thì phương thức là “beijingshizhongguodeshoudu”. Chẳng cần nói nhiều, dùng phương thức này để xử lý dữ liệu Trung văn sẽ đem lại phí tổn lớn hoàn toàn không cần thiết cho việc phán đoán ranh giới từ [nguyên văn từ giới, 词界, word boundary], khiến cho những việc xử lý dữ liệu như tra cứu, xếp thứ tự, và tự động phiên dịch sẽ xảy ra nhiều sai lầm khác nghĩa, làm giảm đáng kể hiệu suất công việc, thậm chí làm cho công tác quản lý vốn dĩ có thể hoàn thành một cách thoải mái lại trở nên khó hoàn thành ; hơn nữa, cho dù có thể thể tất chuyện khác nghĩa thì vấn đề giá thành cao vẫn vượt quá sức tưởng tượng. Chính vì thế mà bao năm nay việc nghiên cứu các công nghệ đọc tự động và dịch tự động của TQ hầu như không có tiến triển thực chất nào.
Xét từ góc độ lịch sử văn hóa, cách viết Trung văn đã nhập khẩu phương pháp đánh dấu chấm câu của phương Tây, làm cho văn tự chữ Hán biểu đạt rõ ràng hơn, chuẩn xác hơn và dễ đọc hơn, tạo điều kiện cho việc xóa nạn mù chữ và giúp nhiều người hưởng cơ hội học tập. Cũng với lý lẽ như vậy, việc sử dụng các phương pháp như Chính từ pháp... để xác định ranh giới từ đã làm cho cách viết Hán ngữ tiến thêm một bước theo hướng rõ ràng, chuẩn xác và dễ đọc, có ý nghĩa tích cực quan trọng đối với việc phát triển công nghệ thông tin Trung văn và hiện đại hóa văn hóa. Việc áp dụng cách “Chú âm chữ Hán” như chủ trương của thuyết “chữ Hán ưu việt” chẳng những là sự thụt lùi văn hóa và tạo trở ngại con người gây ra cho nhiệm vụ phát triển công nghệ thông tin Trung văn, mà hơn nữa, xét từ góc độ đời sống quốc gia, việc chưa trải qua trình tự pháp lý đã phủ định, thậm chí có hành động chống đối các quy phạm tiêu chuẩn liên quan Chính từ pháp nhà nước đã ban hành, là một việc vô lý.
Thuyết “chữ Hán ưu việt” đi ngược lại sự thật và trái với nguyên lý khoa học, nhưng nhiều năm nay thuyết này đã lan tràn khắp xã hội TQ, đầy rẫy trên các báo đài. Thậm chí không ít quan chức nhà nước, viện sĩ, danh nhân, học giả và các nhà văn cũng theo nhau ai nói sao ta cũng bào hao nói vậy.
Muốn tự chủ sáng tạo phát triển công nghệ thông tin Trung văn, muốn nắm quyền chủ động chiến lượcthì TQ phải dọn sạch các sai lầm nghiêm trọng do thuyết “chữ Hán ưu việt” gây ra.
Vì vậy, tác giả trịnh trọng kiến nghị : Xin hãy chớ tiếp tục gieo rắc thuyết “chữ Hán ưu việt” đi ngược lại nguyên lý khoa học và trái với sự thật.
Ghi chú của người dịch:
[1] Mễ A Luân là bút danh của một học giả được Nhân dân Nhật báo (NDNB) TQ giới thiệu  là “nông dân số hóa” sống ở Mỹ, chắc là chuyên gia máy tính TQ. Mạng people.com.cn cho biết : các bài viết của Mễ A Luân đều được bạn đọc hoan nghênh ; đó là công lao của nhóm làm chuyên mục “Xóm Mễ A Luân”, do Chinabyte (của NDNB và Tập đoàn Tin tức cùng tổ chức) chủ trì. Các thành viên Chinabyte đều là chuyên viên chủ chốt của NDNB, mạng people.com, tạp chí Computer World... Các bài viết nhẹ nhàng nhưng sâu sắc, đều nhằm chấn chỉnh những xu hướng sai lầm lớn trong đời sống văn hóa xã hội TQ.
[2] Tỷ lệ sử dụng 6 ngôn ngữ làm việc của LHQ trong soạn thảo các văn kiện ban đầu ở LHQ như sau : Tiếng Anh 80%, Pháp – 15%, Tây Ban Nha – 4%, còn lại 1% – Nga, A Rập, TQ (theo nhà ngôn ngữ số một TQ Châu Hữu Quang).
[3] Nhị tự tiết : dùng 2 bytes để mã hóa 1 ký tự. Tứ tự tiết : dùng 4 bytes để mã hóa 1 ký tự.
[4] Cách ghi âm chữ Hán bằng ký tự chữ Hán cổ, khôngdùng chữ cái Latin, khôngviết hoa được, khôngviết liền được, do đó khôngphân biệt được danh từ riêng.
Nguồn :
学者清理汉字优越” 论的误导
Tác giả:米阿仑.
Nguyễn Hải Hoành biên dịch và ghi chú trong dấu [  ].
http://vanhoanghean.vn/chuyen-muc-goc-nhin-van-hoa/nhung-goc-nhin-van-hoa/can-don-sach-cac-sai-lam-cua-thuyet-chu-han-uu-viet
.


学者:清理“汉字优越”论的误导
米阿仑
2006年01月11日17:23【字号   】【留言】【论坛】【打印】【关闭】 

  多年来,严重违背科学技术原理的“汉字优越”论十分盛行,对社会造成极大误导,对中文信息科技发展也造成极大干扰。要自主创新地发展核心技术和争取获得中文信息科技发展的战略主动权,就需要对“汉字优越”论的误导做一番清理。



  (一)1989年,“汉字优越”论开始弥漫大陆。当时,最流行的一个说法是:联合国文件中,汉字印刷的文件最薄,所以,汉字比英文等文字更优越。由于鼓吹者有联合国总部翻译工作的经历,其说法蒙住了许多人。



  做任何比较都有个起码前提:条件和方式相同。然而,英文书写和汉字书写是不同条件方式:英文是字母符号单线字符串方式,而汉字则是部首笔画平面绘画方式。如果汉字的部首笔画也用单线字符串方式,那么,一个汉字所需要的单线长度往往超过英文字母方式;如果英文词汇也用平面绘画方式,那么,它所需要的平面空间与汉字差不多。

  举个例子,“中国人”用三个汉字符号,英文“CHINESE”用七个不可再分割的书写符号单线串写而成。然而,如果汉字也用不可再分割的符号以单线字符串方式书写,例如部首笔画,那就有“竖、折、横、竖”等14个符号,比英文的字符串长得多。能因此而说英文印刷更薄、因而比中文的汉字更“优越”吗?当然不能。所谓“联合国文件中,汉字印刷的文件最薄,因而汉字更优越”的说法,不具备起码的比较分析常识,那种比较是毫无意义的。

  (二)“汉字优越”论的鼓吹者们说,汉字平均信息量大,所以,汉字比英文更优越。这是望文生义的说法。信息学基本原理说明,某数据所使用的符号系统的平均信息量越大,它的不稳定性和消耗就越大,对数据管理和信息传递是不利因素。例如,英文平均信息熵是4.03比特左右、汉字是9.6比特左右,汉字平均信息量比英文符号大许多。做同样的数据作业,汉字符号系统的总体消耗最大,其信息量大是不利因素。如果平均信息量大能换来更高的平均精密精确度(例如可靠性和避免歧义等等),或许也值得。可是,据海内外专业人员考察分析,汉字和英文等文字符号系统的平均多余度差不多;也就是说,汉字平均信息量大,并没有换来更高的精密精确度、并没有换得更可靠和更有效地避免歧义的实效。要达到大体相同的精密精确度和可靠性,汉字符号系统的消耗比英文符号系统高出许多,能说汉字比英文更“优越”吗?见到“大”就是好,占领了许多人的头脑,于是,见到“汉字平均信息量大”、就望文生义地以为那是多么“优越”,殊不知那是中文数据管理和传递的不利因素。以“汉字信息量大”作“汉字优越”的理由,是违背信息学科学原理和基础知识的。

  (三)“汉字优越”论的鼓噪者们说,计算机操作,汉字输入比英文还快,几个键敲下去就能出现整个词组短句,而英文却要一个个字母敲打,所以,汉字比英文更“优越”。这是缺乏计算机知识的说法。

  了解计算机输入输出原理的人都知道,文字符号如何显示和键盘操作的关系,完全是人为程序所规定的。例如,有程序规定:Zhongguo =“中国”,ren =“人”,zgr = Zhongguo + ren。这样一来,连续敲打“zgr”就会显示“中国人”三个汉字。按照同样方法,英文输入输出也编个程序,敲打“Shakespeare_12”就能显示整部《第十二夜》、几十万个英文符号都显示出来了,能因此而说英文输入比中文汉字输入快、因而英文文字系统比汉字文字系统更“优越”吗?显然不能。

  英文的计算机操作普遍采用一个个字母输入的方法,是为了英文数据全面管理有统一的标准,是为了更好的成本效益,而并非是因为搞英文计算机数据管理的人员连如何规定词组短句的简单程序设计都不知道,更不是因为英文跟其它文字符号相比有什么“优劣”之分。

  (四)“汉字优越”论还有个说法:“汉字所具有的象形表意特点,特别适用于现代科技,是一种更为理想的电脑语言。”这个说法不符合事实,也不符合计算机工作原理。

  自中文计算机技术开始发展以来,为汉字输入法而消耗的时间已有30多年,花费的资金和人力更是无法计算,可是,到目前为止,派出所户口登记和银行开户头为汉字数据库不够用而出现的尴尬多次发生,中文数据传递和处理发生乱码的问题至今没有完全解决。现有汉字数据库是二字节,要包括所有汉字,就必须用四字节,其成本之高和效益之低是不言而喻的。更值得注意的是,就算汉字数据库建设完毕,那也不能满足中文数据全面管理的需要,一切还得从头做起。在这些事实面前,怎么能说是“汉字特别适用于现代科技”和“更为理想的电脑语言”呢?

  所谓“电脑语言”,既不是英文、也不是中文或其它人类使用的语言文字符号,而是由“0”和“1”组成的二进制语言,即“机器语言”。不管某个数据的种类是图象、声音、还是文字,它的计算机处理都是由二进制开关动作完成的,跟它所使用的文字符号是不是象形表意及其书法写法如何都毫无关系。如果汉字符号是比二进制还“更为理想的电脑语言”,为什么全世界没有一台计算机(包括在中国使用的计算机)是取消二进制而采用汉字符号系统而设计制作的呢?

  (五)中国政府早已颁布了现代汉语拼音方案和正词法等语言文字标准规范,并为联合国等国际官方组织所接纳为全球使用的国际标准规范。可是,“汉字优越”论鼓吹者们却说那些标准规范是“左倾”和“盲目西化”,主张回到近百年前的“汉字注音”。由于“汉字优越”论的严重误导,目前,海内外发行的绝大部分中文教材和许多文字资料采用了“汉字注音”方法,给中文数据管理带来了严重的消极后果。

  例如,“北京是中国的首都”这句话,符合国家标准规范的现代汉语拼音书写方式是:“Beijing shi Zhongguo de shoudu”。而“汉字优越”论主张的“汉字注音”书写方式是:“bei jing shi zhong guo de shou du”;到数据处理的时候,其方式是:“beijingshizhongguodeshoudu”。不必多说,用这样的方式来处理中文数据,给词界判断带来了完全不必要的巨大消耗,使检索、排序和自动翻译等数据处理的歧义错误百出,大大降低了工作效率,甚至使本来可以从容完成的管理艰难,而且,即便可以容忍歧义,其成本代价之高超出一般想象。正因为如此,多年来,中国的自动阅读和自动翻译等科研技术几乎就没有获得实质性的发展。

  从文化历史的角度看,中文书写引进西方的标点符号方法,使汉语的文字表达更清晰准确和更容易阅读,为扫盲和帮助更多人享受教育机会提供了条件。同样道理,使用正词法等方法确定词界,将使汉语的文字书写进一步清晰准确和容易阅读,对中文信息技术和文化现代化的发展都有重要的积极意义。而采用“汉字优越”论所主张的“汉字注音”的做法,不但是文化倒退和人为地给中文信息技术发展制造障碍,而且,从国家生活角度看,没有经过法律程序就否定甚至在行动上对抗国家已颁布的正词法等相关标准规范,也是说不过去的。

  违背事实和科学原理的“汉字优越”论泛滥了十六年左右,充斥了许多报刊媒体,甚至不少政府官员、院士、名人学者和作家们也跟着人云亦云。中文信息技术要自主创新发展和掌握战略主动权,就需要清理“汉字优越”论造成的严重误导。为此,笔者郑重地建议:请不要再继续散布违犯科学原理和违背事实的“汉字优越”论了。
来源:人民网(责任编辑:黄维)
http://opinion.people.com.cn/GB/1036/4018643.html
.

Không có nhận xét nào:

Đăng nhận xét

Khi sử dụng tiếng Việt, bạn cần viết tiếng Việt có dấu, ngôn từ dung dị mà lại không dung tục. Có thể đồng ý hay không đồng ý, nhưng hãy đưa chứng lí và cảm tưởng thực sự của bạn.

LƯU Ý: Blog đặt ở chế độ mở, không kiểm duyệt bình luận. Nếu nhỡ tay, cũng có thể tự xóa để viết lại. Nhưng những bình luận cảm tính, lạc đề, trái thuần phong mĩ tục, thì sẽ bị loại khỏi blog và ghi nhớ spam ở cuối trang.

Ghi chú (tháng 11/2016): Từ tháng 6 đến tháng 11/2016, hàng ngày có rất nhiều comment rác quảng cáo (bán hàng, rao vặt). Nên từ ngày 09/11/2016, có lúc blog sẽ đặt chế độ kiểm duyệt, để tự động loại bỏ rác.