读书人

怎么判断一个字符串的内容是什么语言的

发布时间: 2012-02-07 17:45:36 作者: rapoo

如何判断一个字符串的内容是什么语言的?(帮顶有分)
如何判断一个字符串的内容是什么语言的?我只能判断出中文和英文的区别,其他语言呢?怎么判断?
或者换个说法,谁知道其他语言的码值范围?


[解决办法]
不会,帮顶。
等待答案
[解决办法]
有很多种语言参杂在里面算什么?
[解决办法]
不知道

[解决办法]
可能先要确定该字符串使用的哪种字符编码,utf-8,gb2312?在这些编码中,汉字是用一段连续的区间,其他的泰文,韩文等也是这样
[解决办法]
极复杂的问题啊.....
好难!
[解决办法]
有点复杂,顶 一下
[解决办法]
支持一下
[解决办法]
感觉很复杂。
日文和繁体中文某些汉字怎么判断?
比如:日本
你说 日本 是简体中文还是日文?
是繁体中文还是日文?
[解决办法]
:D
[解决办法]
不知道怎么搞
[解决办法]
我只知道如何把字符串转换为其他的语言编码,但是不知道如何判断其语言是什么.是个问题.
[解决办法]
正则表达式可以。但是只能是枚举自己已知内容的unicode字符。
中文:[\u4E00-\u9FA5],匹配到就是中文否则再查
[解决办法]
不过判断语言文化可以用
Currentculture
msdn里搜索:culture
[解决办法]
应该和操作系统的语言相关联的~~
[解决办法]
建议用UNCODE玛来判断全世界的语言都能判断的具体怎么做我不太清楚
[解决办法]
帮顶。

[解决办法]
关注中...
顺便帮顶
[解决办法]
UNCODE 好像只有这编码才有可能...
[解决办法]
不会啊 只能帮你顶一下
[解决办法]
有难度啊,帮你顶下把,关注中
[解决办法]
如果是正确的字符串,它就是Unicode编码
字符串的定义就是Unicode字符的序列~
[解决办法]
楼主可以这样``把他们都转成unicode编码``再做个表,存放每个国家的的字符的范围,哈``虽然耗时了一点``不过相信这个表有些网站是有的``你再写个程序,转换成你要的格式就是了```
[解决办法]
看来只能查表了
[解决办法]
如果不知道编码方式,你不知道字符编码是几个字节,你也就无法分析,一个字符可以是一个两个或者更多字节,
[解决办法]
获取 空格与空格之间的字符串 ..
获取全世界各个文字最常用的一部分 单词表 //比较难吖..
再判断 ~
[解决办法]
关注...

友情帮顶之...
[解决办法]
楼主还不清楚字符串编码格式问题。如果仅仅有一个字符串,本质上和二进制数没什么区别,你需要知道这个字符串的编码格式才能判断这个字符串的内容,进而判断字符串的语言。相同的字符串采用不同编码方式编码的结果是不一样的。反过来,相同的两个字节,用gbk和unicode方式解码出来的内容是不一样的,所以你要知道你的这个字符串采用什么编码格式才能进一步判断是什么语言
------解决方案--------------------


unicode
[解决办法]
顶一下哈
[解决办法]
顶下
[解决办法]
没法判断
[解决办法]
帮顶。
[解决办法]
up
[解决办法]
Unicode应该好一些,各个国家的语言都是在一个区域范围内的,看看字符串所在的区域就知道哪个国家的了
[解决办法]
DING
[解决办法]
DING
[解决办法]
帮顶吧,不知道,期待结果。
[解决办法]
帮顶吧,不知道,期待结果。
[解决办法]
不会帮顶了
[解决办法]
asc
[解决办法]
不会,只能帮顶
[解决办法]
没用的,因为不论什么语言在计算机中都是存储为0和1,
只是每种语言的编码规则不同
所以首先要弄清楚各种语言的编码规则。

这点是很重要的。
[解决办法]
Unicode 编译范围判定~~

但没仔细研究过各种语言的范围段~~
[解决办法]
这个问题真的很复杂,帮你顶了!
[解决办法]
不,你啦。
[解决办法]
System.Text.Encoding.Unicode.GetString(buf);
把你的文字成byte[]型的就可以了。
但是需要弄清楚的是如果你需要的容是一string,string本身是不含格式的需要用指定的言格式才能成正的byte[].
有法判只能成一格式。因不同的言是可以混合使用的而且有些是有明切的言分的如空格和字等
[解决办法]
用眼睛看!
[解决办法]
友情帮顶之...

读书人网 >C#

热点推荐