最近更新的BLOG列表
最新更新的文章列表
汉语会被计算机淘汰吗?
2008-03-02 17:20:40.0
刚才看了几个帖子,帖子里都是在讨论我们的汉语在未来将会怎么样?基本说汉语会被淘汰的有2大观点,1:计算机无法识别汉语(不是指汉字,而是指句子),2:说我们汉字没有在创造汉字的能力!
所以我想聊聊第一个问题!
先说下计算机,由于计算机使用电,而电的状态就只有,连接和断开两个状态!未来表示方面,就用0和1这两个数来表示连接和断开这两个状态,我们暂且把这个成为一个线路!!但是如果用这两个状态去表示我们的世界的话显然是不够的!所以就出现了用8个这样的线路为一个组,然后在用这一组一组的组合去表示我们的世界!比如00000001 表示我们日常使用的1,00000010表示为3!所以计算机能识别的只有0和1这两个数字,也就是二进制!!现实用的都是把他翻译成二进制后,在由计算机去运算!包括英文字母和汉字!
而说计算机无法识别汉语,而能识别英语的朋友,可能都犯了个错误,就是以为计算机能直接识别字母,比如:a、b、c、d等等!所以他们理所当然的认为计算机能识别由英文字母构成的英语!而不能识别汉语,但是你别忘了,汉字也可以通过编译来让计算机接受的!方法:就象我们的区位码一样,把汉字翻译成四位数的十进制数字组合!然后在把这个四位数的数字组合翻译成二进制的010101组合!这样计算机也能识别汉字! 而现在我们的计算机能处理汉字,也是通过这样实现的! 而不是说是先把汉字翻译成英文字母,然后在由汉字识别!
那么既然计算机能识别汉字了!那么怎么样让计算机能识别汉语语句呢!我想这就要我们的,文字学家和数学家去做了!为什么?
因为计算机是靠运算010010的组合来运算出数据,然后在把运算好的数据转化成信号,在显示到显示器的!
那么我们的汉字完全可以都编上十进制码!然后根据计算机的运算特征来让计算机识别和运算汉语语句!比如:
汉语语句“你叫什么名字”,我们先根据计算机的运算特征和我们汉语语句的规则来给汉字编码!假如:你编成1,叫2,什3,么4,名5,字6,!然后换算成二进制:1=0 2=1 3=10 4=11 5=100 6=101! 做加法运算得出1111。 在假如电脑的名字储存在位置是1111的地方,而这个1111的位置已经被固定为是储存名字的地方!当我们输入“你叫什么名字”计算机根据刚才的运算,得出的二进制是1111,然后电脑知道,我们是在问他的名字,然后根据编码找到储存名字的位置编码1111!读出来!这样我们就得到了结果!
但是真正的汉语语句规则和规律,我不知道!所以要语言学家总结出,然后在让数学家把这些规则用数学的方法给每个字编数字码! 那么只要做到这个地方,我想剩的让计算机人员去做就很简单了!
但是汉语语言的规律的统计,是非常复杂,工作量也是很庞大的!不过只要我们完成了,我敢说这个事情的意义绝对不亚于,神州5号和龙芯的意义!
我上面所说的,只是简单描述!具体上做的话我肯定不会,也不行!所以网友们不要说“你说的轻巧,有本事你去做出来,让我看看,我才相信”,如果你这样说我肯定说不过你啊!,但是被忘了,在复杂的事总有解决的时候,只要我们的科研人员去做!1年不行2年,2年不行,10年,我想不出20年绝对能出来!
另外希望支持汉语!汉语的优越性我就不说了!只说我们是炎黄子孙,我们的祖上给我们留下的文字记录都是汉语,我们单单的从了解过去和继承过去的优秀技术来看,!我们更应该是发扬汉语! 而不是去废除汉语!
2008年03月02!
所以我想聊聊第一个问题!
先说下计算机,由于计算机使用电,而电的状态就只有,连接和断开两个状态!未来表示方面,就用0和1这两个数来表示连接和断开这两个状态,我们暂且把这个成为一个线路!!但是如果用这两个状态去表示我们的世界的话显然是不够的!所以就出现了用8个这样的线路为一个组,然后在用这一组一组的组合去表示我们的世界!比如00000001 表示我们日常使用的1,00000010表示为3!所以计算机能识别的只有0和1这两个数字,也就是二进制!!现实用的都是把他翻译成二进制后,在由计算机去运算!包括英文字母和汉字!
而说计算机无法识别汉语,而能识别英语的朋友,可能都犯了个错误,就是以为计算机能直接识别字母,比如:a、b、c、d等等!所以他们理所当然的认为计算机能识别由英文字母构成的英语!而不能识别汉语,但是你别忘了,汉字也可以通过编译来让计算机接受的!方法:就象我们的区位码一样,把汉字翻译成四位数的十进制数字组合!然后在把这个四位数的数字组合翻译成二进制的010101组合!这样计算机也能识别汉字! 而现在我们的计算机能处理汉字,也是通过这样实现的! 而不是说是先把汉字翻译成英文字母,然后在由汉字识别!
那么既然计算机能识别汉字了!那么怎么样让计算机能识别汉语语句呢!我想这就要我们的,文字学家和数学家去做了!为什么?
因为计算机是靠运算010010的组合来运算出数据,然后在把运算好的数据转化成信号,在显示到显示器的!
那么我们的汉字完全可以都编上十进制码!然后根据计算机的运算特征来让计算机识别和运算汉语语句!比如:
汉语语句“你叫什么名字”,我们先根据计算机的运算特征和我们汉语语句的规则来给汉字编码!假如:你编成1,叫2,什3,么4,名5,字6,!然后换算成二进制:1=0 2=1 3=10 4=11 5=100 6=101! 做加法运算得出1111。 在假如电脑的名字储存在位置是1111的地方,而这个1111的位置已经被固定为是储存名字的地方!当我们输入“你叫什么名字”计算机根据刚才的运算,得出的二进制是1111,然后电脑知道,我们是在问他的名字,然后根据编码找到储存名字的位置编码1111!读出来!这样我们就得到了结果!
但是真正的汉语语句规则和规律,我不知道!所以要语言学家总结出,然后在让数学家把这些规则用数学的方法给每个字编数字码! 那么只要做到这个地方,我想剩的让计算机人员去做就很简单了!
但是汉语语言的规律的统计,是非常复杂,工作量也是很庞大的!不过只要我们完成了,我敢说这个事情的意义绝对不亚于,神州5号和龙芯的意义!
我上面所说的,只是简单描述!具体上做的话我肯定不会,也不行!所以网友们不要说“你说的轻巧,有本事你去做出来,让我看看,我才相信”,如果你这样说我肯定说不过你啊!,但是被忘了,在复杂的事总有解决的时候,只要我们的科研人员去做!1年不行2年,2年不行,10年,我想不出20年绝对能出来!
另外希望支持汉语!汉语的优越性我就不说了!只说我们是炎黄子孙,我们的祖上给我们留下的文字记录都是汉语,我们单单的从了解过去和继承过去的优秀技术来看,!我们更应该是发扬汉语! 而不是去废除汉语!
2008年03月02!
文章评论
[以下网友留言只代表其个人观点,不代表中华网的观点或立场]