汉字的格式其实原本不是问题,可是由于目前大多数网页格式制作都是英语国家的人进行的,所以并不符合汉语的格式特点。

在这个追求个性的时代,在网络上,很多人不注意中文格式。我是一个高中生,并且由于高一语文老师的引导而对语文很感兴趣。如果你注意,便会发现我的博客中文字方面少有问题,包括文字错误、标点错误、格式错误。然而,由于计算机技术(CS)的复杂性,很多网络程序存在缺陷,中国大量的网民并不熟悉html格式等内容,所以会出现大量的错误。我们语文老师也是一位网民,他就多次诉说他对那些网络上的文字错误的反感。下面我就根据自己的经验说一下各方面的错误和解决方案。分为“单字错误”、“标点错误”、“格式错误”三部分。

第一:单字错误

这是网络上乃至日常生活中常见的问题,在我的摘录的当代汉语出版物中最常见的100个别字中,显示了我们目前最会出现的错误,而且大多是不为人所注意的。我常买《咬文嚼字》杂志,其中有很多让人汗颜的事例。从小学时,老师就一直教导我们要写对字,可是事实上很多高中、初中,乃至小学的语文教师并不是太注意这件事。记得法国某大报上每周有一个拼字游戏,练习法语的游戏,其参加人数甚至会超过国家大选的投票人数!在这个所谓的“英语”时代中,我们中国人应当也必须承担起保护汉语的责任,我们决不希望在未来的“中文”时代中发现自己居然落伍,那简直是本末倒置。前些天,我小姨家的表妹来我们家玩,她写了小作文让我看,我发现其中充满了一种目前网络上的那种扭捏做作而又文词缺乏的味道。快乐只会“爽”,难过只会“郁闷”,哪有什么“欢欣”、“倜傥”、“义无反顾”、“士为知己者死”、“悲喜交加”、“惆怅”、“踌躇”、“彳亍”、“凄清”可言?还有那“的”“地”“得”,如果用错,只能说明使用者根本连词性(或者说就是自己的意思)都分不清。

不过庆幸的是,由于中文输入法的发展,各种固定格式词语(主要是成语)的输入趋向规范。然而另一方面,由于拼音输入法的自身缺陷,造成很多音似词语的误用。

在我参考的一篇文章中,有这样一段:

《电脑商情报》1月11日33版上的一段“读编往来”令我感觉相当不舒服。

署名“tyyttyyt”的读者指出并纠正了该报49期中多达76处的用字错误,而值班编辑“菊子”则做出了以下这段缺乏诚意的答复:

……说实话在看你的纠错信息时我一直在脑子里思索你是一个什么样的人?我想首先应该是70年代的同龄人吧,其次在工作中一定是一个有着严禁工作态度的人。想想关于“的、地、得”的研究好像只有我们70年代的人那时才这么严格吧……可从去年就有某不记得的编辑告诉我说国家早就发文说可以通用了,为了有一个有力的说服证据,这两年来菊子一直在孜孜的寻找着这份明文规定可是没能如愿……

在看过这段对话之后我脑中冒出的第一个想法就是建议《电脑商情报》尽快辞退这位编辑。

首先,在她(暂且依据网名揣测为女性)对读者纠错的答复中依然出现了许多语病,比如第一句话之后应该是句号而不是问号(这也是小学语文的常考知识点),又比如“只有我们70年代的人那时”根本就是一个在语法上无法成立的短语(这样的问题在HSK中经常作为错误选项出现),比如“可从去年”应该改为“可在去年”或者“可从去年开始”(也许这位编辑确实不以普通话为母语)。

其次,这样的态度严重影响了整份报纸在读者心中的形象。作为一份标榜着“中国城市发行量第一的计算机报”的媒体,必须首先对读者指出的76个低级错误做出足够篇幅的致歉和反思,而不是这样不无调侃地把议论的中心悄悄转移到一份并不存在的“明文规定”上去。

我和该参考文章作者的想法一样,就是要将这位“菊子”辞退。目前很多文摘类杂志都进行“捉‘虫’活动”,我也曾认真参加过,这让我感受到了一些负责任的杂志社的良苦用心。而这《电脑商情报》就有点冒天下之大不韪了。

关于文字问题,主要得依靠大家的重视,平时多看些负责任的杂志、书籍,而不是以乱为美的东西。关于网络的自由性,我觉得大家可以使用一些很娱乐的约定俗成的词语,比如“东东”、“偶”、“酱紫”,乃至一些英文词语。(关于网络语言,请参考wiki的“网络语言”词条)但是一定要保证你的文字能被别人认出,且不被别人讨厌。另外,建议所有人都去http://www.hsk.org.cn/intro_sample.aspx参加一下汉语水平考试(HSK)的高等模拟考试。再者,不要任意使用繁体字乃至异体字,这不仅是违法的,而且是不道德的事。这有追随台湾、香港、澳门等地区的嫌疑。我郑重地说一句:简体字已经开始被国际社会所认可,不仅联合国所使用的中文文件全部是简体中文(那里的电脑、打印机全部是大陆运过去的),而且现在一些国际报纸也开始抛弃繁体中文,比如《纽约时报》在2003年首次使用了一次简体中文的文章标题。如果你注意的话,在新加坡的google网站上,使用的中文也是简体中文。而且我也极度怀疑一些人是否有阅读繁体中文的能力,我虽然接触了不少,且仔细阅读过《简化字表》,但仍然会出现对繁体字的不认识情况。况且繁体字在电脑上以5号字显示时经常看不清。

第二:标点问题

标点问题在纸质时代也不算什么问题,即使有,也顶多是书写潦草而造成的遗漏。而在网络上,标点问题似乎又变成了一个大问题。

在大多数输入法中,提供了将半角的英文标点转化为全角的中文标点的功能。然而为了格式的某些需要,或纯粹是不注意,就会出现在中文文章中大量使用英文标点的现象。我哥哥就喜欢让紫光输入法始终处于输入英文标点的状态,可是我就奇怪他怎么快速输入中文标点,其实完全可以使用“v+英文”的方式输入英文标点。

第三:格式问题

这才是最主要,也最难处理的问题。最主要的问题是段落格式问题。

中文文章每段开始处必须空两格,分段后下一段文字起始于前段文字的次行,即段与段之间不需要空行;而英文写作一般格式是是段前不空格,段间留空行(html中的p标签就是为这样的分段方法准备的)。

由于许多有影响力的网页程序都是英语使用者编写的,所以大多遵守英语规范。而且大多字号很小,显示英语还可以,显示汉语就有些不够,而繁体中文就经常看不清了。

国内许多blog虽然用完全的简体中文写作却采用了英文的分段格式,其中keso方军zheng都具有很相当大的影响力。

此外还有“四不像”的方案:或者在段前空上两格再往段与段之间塞进一条空行,或者在段前不空格在段间也不留白。前者还有向汉语规范靠近的趋势,后者则完全是不负责任的表现。此外还有一些人认为中文与英文之间需要添加空格,就像下面的效果。
这是一个 example 样例
然而我觉得这个问题主要是因为word等软件中的中文字符会与英文字母挤在一起而想出来的处理方法,在html中似乎没有这些问题。

处理方法说简单也简单,说复杂也复杂。简单地说就是将网页中的


通过css的方式处理成标准的中文格式。然而这很多时候又是比较困难的事。我仅说一下WordPress里的处理,主要是和我哥哥学到的内容。只要在模版格式文件(通常是styles.css,也可以修改其他自定义位置)中修改(若没有便增加)

#primary .item .itemtext .entry-content p {
text-indent: 2em;/*这表示段前空两格*/
margin: 0;/*这表示段间距为0*/
}

然而即使解决了这个问题,还是存在许多技术上未“中文考虑”的问题。在wordpress中有普通编辑模式和可视化编辑模式。在普通编辑模式下,输入的回车会自动转化成
从而不受管理,并且极不符合规范;在可视化编辑模式下,虽然能够将回车转化为


但是它的自动化使得无法使用很多插件的标记。

我曾经用VB制作一个小软件来处理收藏网页文字中的格式问题,主要是段与段间多一空行、段前使用手工空格等问题。我决定以后制作一个WordPress专用的博客书写器,不仅在输入的时候自动处理各种格式符号,而且可以承担起处理杂乱格式的优化工作。

有趣的是,在那篇“请规范您的键盘”中,他也是用两个全角空格来处理段前空格问题,这是很不好的现象,但是很多时候也只能如此。我希望大家能够使用更规范的处理方式。

在网络上,如果有人说起这些问题,最中肯的语言莫过于“网路还是比较自由的,在文字和格式上不要过于苛求,但是还是对作者的认真态度折服。”但是我从这类文字中看出某种凄凉,似乎大家都一边表示会注意,一边鄙视“多嘴人”。我无语……好在随着中国网络的发展,我看到了越来越多的人开始爱护我们的汉语了。

本文参考:flypig的“请规范您的键盘”文章