跳至主要內容
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?

4563博客

全新的繁體中文 WordPress 網站
  • 首頁
  • 正确填写与获取下载文件名
未分類
11 6 月 2021

正确填写与获取下载文件名

正确填写与获取下载文件名

資深大佬 : anzu 4

我用 requests 下载文件,文件名在 response header 的 Content-Disposition 中, 在浏览器中虽然 devtools 解析乱码,但下载弹框的文件名正确,而在程序中获取到的内容也是乱码,类似于

attachment; filename=影宅 シャドーハウス 01;filename*=utf-8''影宅 シャドーハウス 01 

经过尝试,可能是进行了如下错误解码

    raw = '影宅 シャドーハウス 01'     b = bytes(raw, 'utf8')     dec = b.decode(encoding='iso-8859-1', errors='replace')     print(dec) 

output:

影宅 シャドーハウス 01 

逆向解码:

print(bytes(dec, 'iso-8859-1').decode('utf8')) 

按规范来说,接收方不保证能解析 utf8 header,所以各位开发同学请不要再在 header 中填入 utf8 内容了!

大佬有話說 (3)

  • 資深大佬 : swulling

    嗯,放 utf8 不符合规范,标准做法是 URL-encode

  • 資深大佬 : Kobayashi

    “attachment; filename*=utf-8”{}”.format(quote(filename))
    – filename* 而不是 filename
    – utf-8 后 2 个单引号不是打字错误
    – quote() 为 urllib.parse.quote
    纯 ascii 字符使用 filename=,否则 filename*=
    完整代码参考 Starlette FileResponse 对象
    https://github.com/encode/starlette/blob/15761fb48e4c56be09167cb8f9b761114593b651/starlette/responses.py#L257-L265

  • 資深大佬 : Kobayashi

    当然并不是所有人都按规矩办事。规范中 header 编码是 latin-1/iso-8859-1,对方服务器可能使用 utf-8 编码 header,而浏览器默认使用 iso-8859-1 解码有乱码。所以有了 encode(‘iso-8859-1’).decode(‘utf-8’).
    以前在腾讯乐享的 Set-Cookie 见过这种情况。Chrome 旧版会尝试使用 utf-8 解码,新版遵循了规范只使用 iso-8859-1.

文章導覽

上一篇文章
下一篇文章

AD

其他操作

  • 登入
  • 訂閱網站內容的資訊提供
  • 訂閱留言的資訊提供
  • WordPress.org 台灣繁體中文

51la

4563博客

全新的繁體中文 WordPress 網站
返回頂端
本站採用 WordPress 建置 | 佈景主題採用 GretaThemes 所設計的 Memory
4563博客
  • Hostloc 空間訪問刷分
  • 售賣場
  • 廣告位
  • 賣站?
在這裡新增小工具