WordNet
- the 10th letter of the Roman alphabet (同)j
PrepTutorEJDIC
- (連続するものの)10番目,第10番のもの
Wikipedia preview
出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2017/04/21 10:26:07」(JST)
[Wiki ja表示]
|
出典は列挙するだけでなく、脚注などを用いてどの記述の情報源であるかを明記してください。記事の信頼性向上にご協力をお願いいたします。(2013年1月) |
ISO-2022-JPは、インターネット上(特に電子メール)などで使われる日本の文字用の文字符号化方式。ISO/IEC 2022のエスケープシーケンスを利用して文字集合を切り替える7ビットのコードであることを特徴とする (アナウンス機能のエスケープシーケンスは省略される)。俗に「JISコード」と呼ばれることもある。
目次
- 1 概要
- 2 類似の符号化方式
- 3 ISO-2022-JPと非標準的拡張使用
- 4 参考資料
概要
日本語表記への利用が想定されている文字コードであり、日本語の利用されるネットワークにおいて、日本の規格を応用したものである。また文字集合としては、日本語で用いられる漢字、ひらがな、カタカナはもちろん、ラテン文字、ギリシア文字、キリル文字なども含んでおり、学術や産業の分野での利用も考慮したものとなっている。規格名に、ISOの日本語の言語コードであるja
ではなく、国・地域名コードのJP
が示されているゆえんである。
文字集合としてJIS X 0211のC0集合(制御文字)、JIS X 0201のラテン文字集合、ISO 646の国際基準版図形文字、JIS X 0208の1978年版 (JIS C 6226-1978) と1983年および1990年版が利用できる。JIS X 0201の片仮名文字集合は利用できない。1986年以降、日本の電子メールで用いられてきたJUNETコードを、村井純、Mark CrispinおよびErik van der Poelが1993年にRFC化したもの (RFC 1468)。後にJIS X 0208:1997の附属書2としてJISに規定された。MIMEにおける文字符号化方式の識別用の名前としてIANAに登録されている。
なお、符号化の仕様についてはISO/IEC 2022#ISO-2022-JPも参照。
類似の符号化方式
「ISO-2022-JP」に類似した符号化方式として以下のようなものがある。なお、一部は MIME で用いる文字符号化方式として IANA が登録している。
- ISO-2022-JP-1
- RFC 2237。ISO-2022-JPを拡張し、ISO-2022-JPの文字集合に加え、JIS X 0212を利用できるようにしたもの。
- ISO-2022-JP-2
- RFC 1554。ISO-2022-JPを拡張し、ISO-2022-JPの文字集合に加え、JIS X 0212、KS X 1001、GB 2312、ISO 8859-1、ISO 8859-7を利用できるようにしたもの。
- ISO-2022-JP-3
- JIS X 0213:2000の附属書2に記述される符号化表現で、ISO-2022-JPの漢字集合をJIS X 0213に変えるなどしたもの。IANA登録簿への登録が提案されたが、RFC 2278(当時。RFC 2978により廃止された)の手続きに従っていない(いっぺんに複数の文字コードを登録する手続きは存在しないのに6つ同時に申請されている)などの理由により却下された[1]。
- ISO-2022-JP-2004
- JIS X 0213:2004の附属書2に記述される符号化表現。ISO-2022-JP-3の漢字をJIS X 0213:2004に改めたもの。IANA登録簿への登録はまだされていない。
ISO-2022-JPと非標準的拡張使用
「JISコード」(または「ISO-2022-JP」)というコード名の規定下では、その仕様通りの使用が求められる。しかし、Windows OS上では、実際にはCP932コード(マイクロソフトによるShift_JISを拡張した亜種。ISO-2022-JP規定外文字が追加されている。)による独自拡張(の文字)を断りなく使うアプリケーションが多い。この例としてInternet ExplorerやOutlook Expressがある。また、EmEditor、秀丸エディタやThunderbirdのようなマイクロソフト以外のWindowsアプリケーションでも同様の場合がある。この場合、ISO-2022-JPの範囲外の文字を使ってしまうと、異なる製品間では未定義不明文字として認識されるか、もしくは文字化けを起こす原因となる。そのため、Windows用の電子メールクライアントであっても独自拡張の文字を使用すると警告を出したり、あえて使えないように制限しているものも存在する。さらにはISO-2022-JPの範囲内であってもCP932は非標準文字(FULLWIDTH TILDE等)を持つので文字化けの原因になり得る。
また、符号化方式名をISO-2022-JPとしているのに、文字集合としてはJIS X 0212(補助漢字)やJIS X 0201の片仮名文字集合(いわゆる半角カナ)をも符号化している例があるが、ISO-2022-JPではこれらの文字を許容していない。これらの符号化は独自拡張の実装であり、中にはISO/IEC 2022の仕様に準拠すらしていないものもある[2]。従って受信側の電子メールクライアントがこれらの独自拡張に対応していない場合、その文字あるいはその文字を含む行、時にはテキスト全体が文字化けすることがある。
参考資料
- J. Murai 他 (1993年6月). RFC 1468 Japanese Character Encoding for Internet Messages (『インターネットメッセージのための日本語文字符号化』).
- M. Ohta 他 (1993年12月). RFC 1554 ISO-2022-JP-2: Multilingual Extension of ISO-2022-JP (『ISO-2022-JP-2: ISO-2022-JPの多言語拡張』).
- K. Tamaru 他 (1997年11月). RFC 2237 Japanese Character Encoding for Internet Messages (『インターネットメッセージのための日本語文字符号化』).
- 日本規格協会 (2000年). JIS X 0213:2000 『7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合』 (7-bit and 8-bit double byte coded extended Kanji sets for information interchange) 附属書2「ISO-2022-JP-3符号化表現」.
- 日本規格協会 (2004年). JIS X 0213:2000/AMENDMENT 1:2004 『7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合 (追補1)』 (7-bit and 8-bit double byte coded extended Kanji sets for information interchange (Amendment 1)) 附属書2「ISO-2022-JP-2004符号化表現」.
- ^ Harald Tveit Alvestrand (Fri, 07 Apr 2000 10:41:39 +0200). “Rejection of registration of new Japanese charsets”. ietf-charsets@w3.org Mailing List. 2008年2月2日閲覧。 - ISO-2022-JP-3登録の却下の経緯。
- ^ 森山将之 (1997年6月3日). “JIS X 0201 片仮名”. 2008年2月2日閲覧。
文字コード |
Category:文字コード |
日本語用の
文字コード |
JIS規格 |
符号化文字集合 |
- JIS X 0201
- JIS X 0208
- JIS X 0212
- JIS X 0213
- JIS X 0221
|
文字符号化方式 |
- ISO-2022-JP
- EUC-JP
- Shift_JIS
- Shift_JISX0213
- Shift_JIS-2004
- EUC-JISX0213
- EUC-JIS-2004
- ISO-2022-JP-3
- ISO-2022-JP-2004
- 漢字シフトコード
|
文字一覧 |
- JIS X 0213非漢字一覧
- JIS X 0213漢字一覧の1面
- JIS X 0213漢字一覧の2面
|
|
JIS以外の公規格 |
|
メーカーの規格 |
符号化文字集合 |
- iモード絵文字
- EZweb絵文字
- SoftBank絵文字
- 今昔文字鏡
- JIPS
- EBCDIC
- GT書体
- KEIS
- IBM漢字システム
- Adobe-Japan1
- レコード用文字符号
- ビブロス外字
|
文字符号化方式 |
- Microsoftコードページ932
- MacJapanese
- JEF漢字コード
- U-PRESS
|
|
|
日本語を含む
多言語文字集合 |
Unicode |
面 |
- 基本多言語面
- 追加面
- 追加多言語面
- 追加漢字面
- 第三漢字面
- 追加特殊用途面
- 私用面
|
文字符号化方式 |
- UTF-8
- UTF-16/UCS-2
- UTF-32/UCS-4
- UTF-7
- UTF-EBCDIC
- GB 18030
- SCSU
- BOCU-1
|
文字一覧 |
- Unicode一覧
- Unicode一覧表
- Unicode6.0の携帯電話の絵文字の一覧
- UnicodeのEmojiの一覧
|
|
TRONコード |
|
|
日本語以外用の
文字集合 |
|
ソフトウェア |
- 文字コード表 (Windows)
- 文字パレット
- KCharSelect
- IMEパッド
|
区分け |
- 外字
- 図形文字
- 制御文字
- 特殊文字
- C0 and C1 control codes
- CJK統合漢字
- ワイド文字
- マルチバイト文字
- 機種依存文字
|
概念 |
|
関連トピック |
- CCSID
- charset detection
- ISO 6429/IEC 6429/ANSI X3.64
- legacy encoding
- 文字化け
- モールス符号
- 6ビット文字コード
- 携帯電話の絵文字
- 機械彫刻用標準書体
|
|
UpToDate Contents
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
Japanese Journal
- 日本語文字JIS規格への点字の追加(ヒューマンコミュニケーショングループ(HCG)シンポジウム)
- 相川 哲弥
- 電子情報通信学会技術研究報告. WIT, 福祉情報工学 105(684), 19-24, 2006-03-15
- 日本語文字JIS規格(いわゆるJISコードやShift JISコードの表)には、点字64個を早急に追加すべきであると、提案する。
- NAID 110004690105
- 2.電子辞書による難読漢字の検索について (大学の一般教養科目・第二外国語科目における電子メディア教材・資料についての研究)
Related Links
- 文字コード表 JISコード(ISO-2022-JP) JISコードの1バイトコード(半角文字)のエリア 0x00~0x1f、0x7f は制御コードです 0x20~0x7e はASCII文字です 0x21~0x5f は JIS7(7ビットJIS)の半角カタカナです 0xa1~0xdf は JIS8(8ビットJIS)の ...
- JIS拡張漢字(JIS X 0213:2004)の表です。JIS拡張漢字はすべてUnicodeに収録されており、数値文字参照で記述することができます。ただし、数値文字参照による記述部分はOSやブラウザのバージョンなどの環境によっては、文字化けする ...
Related Pictures
★リンクテーブル★
[★]
- 英
- (暗号)code、(ひも)cord、code
- 関
- 腱、規範、索、番号、ひも
[★]
- 関
- joule