跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 遇到一个奇怪的 bug,一头雾水~大家帮忙看看?
未分類
25 11 月 2020

遇到一个奇怪的 bug,一头雾水~大家帮忙看看?

遇到一个奇怪的 bug,一头雾水~大家帮忙看看?

資深大佬 : firhome 11

页面上请求一个接口 A,

这个接口 A 有一个 字段 text,varchar(2000) ,mysql utf-8 。

然后在 windows 7 电脑上 一句话里面有几个字会显示 方块。 接口返回,页面展示会显示方块

但是在其它电脑上完全正常。

然后查了一下发型两个字的字符编码完全不同

比如:“你好” (用户不知道从哪里 copy 过来的就是不能用),但是我本地重新写个“你好” 确可以使用。

但是长的确一模一样。

前端就是一个 input 输入框 用户 copy 后端直接存。 显示的时候 就是 win7 有几个字出现方块(接口返回也是方块)

大佬有話說 (20)

  • 資深大佬 : shintendo

    然后查了一下发型两个字的字符编码完全不同
    ——–
    字符编码贴一下呗

  • 資深大佬 : KuroNekoFan

    utf8-bom?

  • 資深大佬 : opengps

    从 word 里换个字体试试?

  • 主 資深大佬 : firhome

    @shintendo [⻓] 和 [长] 就这两个字,第一个字 win7 里显示 方块,第二个字 是我打的正常。我不确定这样直接回复 出来还对不对。

  • 資深大佬 : CloudnuY

    @firhome #4 这两个字不是一个字,第一个是 [中日韩字根简体中文长] unicode 编号 U+2ED3,第二个是 [中日韩象形文字长] unicode 编号 U+957F

  • 主 資深大佬 : firhome

    @CloudnuY 那这种问题该怎么解决呢?

  • 資深大佬 : hahastudio

    你别说还真不一样
    ‘⻓’ 0x2ed3 在中日韩汉字部首补充里
    ‘长’ 0x957f 在中日韩统一表意文字列表里
    通常打出来的都是 0x957f

  • 資深大佬 : yiXu

    确实不一样,前者是 u2ed3,后者是 u957f

  • 資深大佬 : yiXu

    页面显示编码支持就行,如果不支持,那就没办法,只能转换到支持的编码吧

  • 資深大佬 : liyang5945

    刚才在调试工具里试了下:
    ‘长’.charCodeAt(0) ==>38271
    ‘⻓’.charCodeAt(0)==>11987
    就是字符编码不一样呗,猜测可能是繁体字符 ?

  • 主 資深大佬 : firhome

    @yiXu 关键是就 win7 不行, 如果转的话 是人工转呢 还是 ?

  • 資深大佬 : CloudnuY

    @firhome #11 人工做一个字典库吧,遇到一个加一条

  • 資深大佬 : hahastudio

    也许要修改一下 Windows 的 Region ?

  • 資深大佬 : yiXu

    @firhome 页面编码不是 utf-8 ?是否可以设置为 utf-8

  • 資深大佬 : Curtion

    查了一下,这俩的编码来自:中日韩汉字部首补充和中日韩统一表意文字,估计是不同的机构定义的?

  • 主 資深大佬 : firhome

    @yiXu 是 utf-8

  • 資深大佬 : lxk11153

    https://en.wiktionary.org/wiki/%E9%95%BF
    > U+957F, 长
    > CJK UNIFIED IDEOGRAPH-957F
    > U+2ED3, ⻓
    > CJK RADICAL C-SIMPLIFIED LONG

    你说的”你好”没看到。

  • 主 資深大佬 : firhome

    @lxk11153 我那是之前举例, 看我补充内容,那个 长 字

  • 資深大佬 : yiXu

    @firhome 是否是字体问题。https://developer.ibm.com/zh/articles/analysis-and-summary-of-common-random-code-problems/#%E5%9B%BE-8-%E5%B8%A6%E6%9C%89%E4%B8%AD%E6%8B%AC%E5%8F%B7%E7%9A%84%E4%B9%B1%E7%A0%81

  • 資深大佬 : imn1

    CJK Radicals Supplement Range: 2e80 ~ 2eff (这范围也就 128 个字符)
    主要是汉字的偏旁部首,有少量简单汉字,但也是作为汉字的“部分”来看待的
    这些字符一般需要特殊方式输入,不是平常打字打出来的
    写段代码识别一下就行了

    而后面说的“字型”、“你好”那些,应该就是 GBK 和 utf-8 的区别

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具