Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

fix(encoding): ISO-2022-JPのページで文字化けが発生する問題を修正 #40

Draft
wants to merge 2 commits into
base: master
Choose a base branch
from

Conversation

kakkokari-gtyih
Copy link

@kakkokari-gtyih kakkokari-gtyih commented Nov 19, 2024

  • ISO-2022-JPのページで文字化けが発生する問題を修正
  • 文字コードの特定にも失敗していたので、可能ならばレスポンスヘッダから文字コードを取得するように仕様変更

Fix #39

@mei23
Copy link

mei23 commented Dec 25, 2024

文字コードの特定にも失敗していたので、可能ならばレスポンスヘッダから文字コードを取得するように仕様変更

Header: text/html; charset=ISO-8859-1
Meta: text/html; charset=Shift_JIS

みたいにHeaderが間違ってるサーバーだとどうなるかしら?

Apacheでディストリとかによっては、AddDefaultCharsetでヘッダーのcharsetが不正な値に固定されてしまっていることが稀にあるはずだわ。

@mei23
Copy link

mei23 commented Dec 25, 2024

文字コードの特定にも失敗していたので

https://www.comiket.co.jp/info-c/C97/C97genre.html の認識は成功してる気がするのだわ

detected { encoding: 'ISO-2022-JP', confidence: 0.99 }

@kakkokari-gtyih kakkokari-gtyih marked this pull request as draft February 2, 2025 04:29
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

ISO-2022-JPのページが文字化けする
2 participants