十世纪以前的越南曾是中国的郡县。秦、汉、隋、唐莫不在此设官统辖,故受中国文化的影响较深。越南独立后,无论是上层人士的交往,还是学校教育以及文学作品的创作,均以汉字为工具。直至十三世纪,越南才有本国文字——字喃。字喃是以汉字为基础,用形声、假借、会意等方法创制的表达越南语音的新字。十五世纪时,字喃通行全国,完全取代了汉字。
[编辑本段]
计算机汉字
中文信息处理由于打字机键盘在设计时本身没有考虑汉字输入的问题,输入汉字往往比输入拼音文字困难。汉字没有经过中文打字机的普及,直接进入了电脑中文信息处理阶段。在电脑发明初期曾引起汉字能否适应电脑时代的问题,支持汉字拉丁化的学者甚至以此为理据。
随着各种中文输入法的出现,汉字的计算机输入、存储、输出技术得到了基本解决,大大提高了中文写作、出版、信息检索等的效率。目前中文输入法有上千种之多,主要包括表音输入和表形输入两类,也有两者兼之的。汉字的语音输入、手写识别和光学字符识别(OCR)技术也已得到广泛应用。
如收录数千字的GB2312(中国大陆)、Big5及CNS11643(台湾)、HKSCS(香港)、JIS(日本),以及收录两万多字的GBK(中国大陆)、国际标准Unicode、ISO10646等等。在这个过程中,因为技术及其他种种因素,在收录字数,及收录字体等方面或做不同层次的调整。
中国大陆当局为了解决邮政,户籍整理等领域用字的迫切需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB18030-2000,共收汉字27484个。并强制所有在中国大陆地区售卖的计算机产品必须使用这个新官方标准。
汉字编码系统为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。
国标码(“国标”是中华人民共和国国家标准的简称)在中国大陆使用。GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。
BIG5码。收录13053个汉字。在台湾和香港使用的一字节或两字节编码。
Unicode并不被中国政府很好的接受。中国政府要求在中国大陆出售的软件必须支持GB18030编码。
在国际通信化和软件设计领域,CJK编码收集了汉语、日语、韩语中的汉字集。
[编辑本段]
三大汉语词典
目前世界三大汉语词典分别是中国大陆的《汉语大词典》(共13册,5.6万词条,37万单词)、中国台湾的《中文大辞典》(共10册,5万词条,40万单词)以及日本的《大汉和辞典》(共13册,4.9万词条,40万单词)。而《韩汉大辞典》收录了6万个词条,词汇量达到50万,在词条和词汇量方面都超过了上述三大汉字相关词典。汉字是记录汉语的文字,它已有六千年左右的历史,它是世界使用人口最多的语言,是世界上最古老的文字之一。
[编辑本段]
汉字之最
最常用的500个汉字
的、一、是、在、不、了、有、和、人、这、中、大、为、上、个、国、我、以、要、他、时、来、用、们、生、到、作、地、于、出、就、分、对、成、会、可、主、发、年、动、同、工、也、能、下、过、子、说、产、种、面、而、方、后、多、定、行、学、法、所、民、得、经、十、三、之、进、着、等、部、度、家、电、力、里、如、水、化、高、自、二、理、起、小、物、现、实、加、量、都、两、体、制、机、当、使、点、从、业、本、去、把、性、好、应、开、它、合、还、因、由、其、些、然、前、外、天、政、四、日、那、社、义、事、平、形、相、全、表、间、样、与、关、各、重、新、线、内、数、正、心、反、你、明、看、原、又、么、利、比、或、但、质、气、第、向、道、命、此、变、条、只、没、结、解、问、意、建、月、公、无、系、军、很、情、者、最、立、代、想、已、通、并、提、直、题、党、程、展、五、果、料、象、员、革、位、入、常、文、总、次、品、式、活、设、及、管、特、件、长、求、老、头、基、资、边、流、路、级、少、图、山、统、接、知、较、将、组、见、计、别、她、手、角、期、根、论、运、农、指、几、九、区、强、放、决、西、被、干、做、必、战、先、回、则、任、取、据、处、队、南、给、色、光、门、即、保、治、北、造、百、规、热、领、七、海、口、东、导、器、压、志、世、金、增、争、济、阶、油、思、术、极、交、受、联、什、认、六、共、权、收、证、改、清、己、美、再、采、转、更、单、风、切、打、白、教、速、花、带、安、场、身、车、例、真、务、具、万、每、目、至、达、走、积、示、议、声、报、斗、完、类、八、离、华