有没有办法将文本从Unicode转换为ASCII?
|
我需要的是,对于每个ASCII字符,一个等效的Unicode字符列表。
问题是,当人们在文档中键入内容时,诸如Microsoft Excel和Word之类的程序会插入非ASCII双引号,单引号,破折号等。我想将此文本存储在\“ varchar \”类型的数据库字段中,该字段需要单字节字符。
为了存储ASCII(单字节)文本,可以将其中一些Unicode字符视为与特定ASCII字符等效或足够相似,以将Unicode字符替换为等效ASCII字符就可以了。
我想要一个简单的函数,例如MapToASCII,它将Unicode文本转换为等效的ASCII,从而允许我为与任何ASCII字符都不相似的任何Unicode字符指定替换字符。
没有找到相关结果
已邀请:
2 个回复
拟僚疽刊剔
敦肌
具体来说,该代码将生成一个HTML表单,其中包含BMP中的所有字符,以及以前缀“ \ r _ \”(r表示\“替换值\”)的十六进制值命名的输入文本框。如果将其移植到ASP.NET页,则可以编写其他代码来尽可能多地预填充替换值: 具有自己的值(如果已经是ASCII),或者 使用Unicode规范化的FormD或FormKD分解的等效项,或者 整个类别的单个ASCII值(即带有ASCII双引号的所有\“标点符号\”字符) 然后,您可以手动进行调整,并且可能不需要您想的那么长。只有64512个代码点,整个类别的大块可能会被忽略为“甚至没有接近ASCII的字符”。因此,我将构建此映射和功能。