～趣味工房：ZSWORKS.com～ /

▼月間ログ

2024年
　 12 11 10 09 08 07 06 05 04 03 02 01
2023年
　 12 11 10 09 08 07 06 05 04 03 02 01
2022年
　 12 11 10 09 08 07 06 05 04 03 02 01
2021年
　 12 11 10 09 08 07 06 05 04 03 02 01
2020年
　 12 11 10 09 08 07 06 05 04 03 02 01
2019年
　 12 11 10 09 08 07 06 05 04 03 02 01


▽e-bike＆自転車
	COSWHEEL-SMARTEV Part.0 　電動自転車購入。　＋初手荷カゴ設置＆シート下げ加工
	COSWHEEL-SMARTEV Part.1 　設定変更で航続距離よりもパワー優先へ　ペダルとって電動バイク専用化
	COSWHEEL-SMARTEV Part.2 　DC/DCコンバータ直給電は不可.. 　増槽タンクとして有効活用します。
	COSWHEEL-SMARTEV Part.3 　アスファルト舗装道路をメインに　走るときに適切なタイヤは・・
▽PC/DIY系あれこれ
	和室からの改装＆有線LAN工事　畳⇒カーペットへの張替えDIY 　＆有線LANを外壁敷設する
	Apple TimeCapsule HDD交換　500GB⇒4.0TBへHDD-Swap。　非動画アーカーイブ用として使用
	Lenovo IdeaPad 330シリーズ　HDD 500GB⇒SSD 120GB化　光学ドライブ⇒SSD 1.0TB化
	Pana Letsnote SX1 SSD化他　SSD換装＆メモリ増設.
	NEC VersaProで自宅鯖導入　SSD増設＆メモリ増設して共有鯖　＋外からみえるように
	FUJITSU ESPRIMO FH77/HD 　光学ドライブ⇒SSD化とHDD換装　起動順番入れ替えなどなど
	Lenovo G570シリーズ液晶割れ　液晶パネル割れのLenovoから　D-Sub15pin画像出力設定する。
▽デジタルカメラ類
SONY ILCE-7R MarkⅡ＆レンズ　初めてのフルサイズミラーレス
Olympus E-PL6(JUNK)＆レンズ　手ブレ補正回路が死んでるE-PL6
NIKON 1 S2(JUNK)＆レンズ　内蔵スピーカー不良＆レンズなし
GoPro Hero7/9とアクセサリ　GoProファミリー
▽Webネタ/スマホ関連
HTMLの編集は無料ソフトで十分　有料アプリは一切使わず、格安サーバで運営しています。
unicode濁点と半角カナ処理　unicode濁点まじりと半角カナを　意識させず全角カナに変換するヤツ
AdGuard DNSで広告排除　無料の「Public AdGuard DNS」でバナー広告/POPUP広告を削除！
ZTE Libero 5G(A003ZT)の中古　ZTE Libero 5G(Y!mobile版)を　docomo-MVNO(mineo)で使うよ！
XPERIA1 SOV40[赤ROM]を再利用　赤ROM機を他キャリアで流用する。　楽天からdocomo-MVNOへ引っ越し

▽TAGショートカット

　日常雑談　
　日曜工作DIY　
　カメラとレンズのお話　
　電動アシスト自転車　
　電動自転車　
　COSWHEEL　
　ケータイ話　
　格安SIM　
　工具のお話　
　JUNK捕獲　
　政治家のお話　

Caution!! For non-Japanese speaking people
　original page is written in Japanese only.
　If you view this page via a translation site, you may not be able to accurately convey the nuances we intend.

■Unicode に揃えるのが基本ですよってのは理解しているんです。

Internetなんてできる前のむか～し昔、パソコン通信とかの頃。文字コードが統一されてなく、
事実上の標準はMS-DOS/PC-98で普通に使われていたSHIFT-JISというのが業界標準だったんです。

ですがSHIFT-JIS必須なんて話は大昔の話ですでに化石な話しです！

既にWeb界隈では [UTF-8N(UTF-8でBOMなし)]で保存するのが暗黙の了解になっていますが、
昔ながらのOS標準のWindowsソフト達は未だにSHIFT-JIS依存が残るのが実情だったりするわけです。
そして文字コード変換できるテキストエディタで逐一都度相互変換するのも面倒この上ないし
Unicode対応させる為だけに市販ソフトに金払って更新するのは正直げんなりします。
(未だに某価格比較サイトからダウンロードできる商品データファイルは, SHIFT-JISなCSVファイルですし)

～～.CSVなテキストファイルを取り込みする部分にSHIFT-JIS ⇒ UTF-8Nに変換する行を入れる。
～～.CSVなテキストファイルを保存する部分にはUTF-8N ⇒ SHIFT-JISに変換する行を入れる。
(他人もデータを弄る可能性があるときはSHIFT-JIS準拠にしとくのが吉です。データ壊されたくないし。)

なので、
★ブラウザ上で処理できるものは処理する。
★perl上でオーバーヘッド少なく変換できるなら処理する。
・・・というのが基本的な対応となります。

HTMLファイルを変換するときにはひと手間追加が必要です。　文字コードとHTML表記を一致させる必要がある。
これに関してはSHIFT-JISな.htmlファイルをゴリゴリUTF-8に置換る場合perlで入出力したとき、
｜use Encode;
～～～[中略]～～～
｜foreach $line (@data) {
｜　　$line = decode('cp932', $line);
｜　　$line =~ s/charset=shift_jis/charset=UTF-8/g;
｜　　$line = encode('utf8', $line);
｜}
これで @data にセットされているHTMLソースコードは "UTF-8で書かれた装丁" になる。
(charsetを置き換えてるのはファイルの文字コードとHTMLファイル内の文字コード宣言を一致させるため)

UTF-8N変換するだけじゃすまない問題を見つけたのでその対策もする

■Unicodeの怪現象。カタカナの濁音/半濁音の例外処理。

何故か濁音カタカナが合字処理されている箇所があるのはなぜだ。。・・これは面倒くさい・・
具体例:ファイル名検索で濁点ありが一致しなくなる

★全角カタカナが合字処理されてしまう問題。
　macOSのファイル管理システムが濁点を「合字するほうが正しい」という思想で設計されてしまっているため、
　ファイル名として入力されたカタカナが濁音カタカナではなく合字処理するのが正しいとされています。
　「ガ」とか「パ」とかが「か」＋「゛」の合字としてファイル名処理されてしまっている・・・・
　この合字カナファイル名がメールの添付ファイルやコピペなりでInternet上で広がってしまう..

モダンなブラウザならJavaScriptでonChangeイベントに「form.String.normalize()」で
都度変換するのがすごく楽だけど、IEとかAndroidのOS内蔵ブラウザはスルーしてしまうし、
"神と神"とか"高と髙"とか。人名とかは変換されてしまうと失礼な場合があるんでこの方法は使えない・・

そうなってくると便利な関数を使わずローテクJavaScript変換する手法しかない。

ぱぱっと作ったのは「JavaScript側で半角カタカナを潰すついでで合字も一緒に変換」する関数です。
inputタグの onchange に呼び出すのを追加しておくと、たとえコピペで半角カタカナや合字が
コピペで入ったとしてもフォーム入力途中に変換されるので、サーバ上に届く前に合字/半角カタカナが駆除される。
ローテクで雑な変換だけど、onchangeで呼び出されるものにスピードやエレガントさを求めてもしょうがない。

必要な動作をしてくれれば問題ない。合字全角カナが気がついたら消えていく仕込み。

～・～ HTML内表記～・～

<form name="xx">変換テスト:<inputstyle="width:400px" name="test"
　onchange="document.xx.test.value=toZenkaku(document.xx.test.value);"></form>

～・～ JavaScript表記～・～

function toZenkaku(motoText){
txt ="ｱｲｳｴｵｶｷｸｹｺｻｼｽｾｿﾀﾁﾂﾃﾄﾅﾆﾇﾈﾉﾊﾋﾌﾍﾎﾏﾐﾑﾒﾓﾔﾕﾖﾗﾘﾙﾚﾛﾜｦﾝｧｨｩｪｫｬｭｮｯ､｡ｰ｢｣+&?";
zen = "アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホ";
zen+= "マミムメモヤユヨラリルレロワヲンァィゥェォャュョッ、。ー「」＋＆？";
str = "";

for (var i=0; i<motoText.length; i++){
    var c = motoText.charAt(i);
    var n = txt.indexOf(c,0);
    if (n >= 0) c = zen.charAt(n);
    str += c;
}

str = str.replace( /カﾞ/g, "ガ" ); str =str.replace( /キﾞ/g, "ギ" );
str = str.replace( /クﾞ/g, "グ" ); str =str.replace( /ケﾞ/g, "ゲ" );
str = str.replace( /コﾞ/g, "ゴ" );
str = str.replace( /サﾞ/g, "ザ" ); str =str.replace( /シﾞ/g, "ジ" );
str = str.replace( /スﾞ/g, "ズ" ); str =str.replace( /セﾞ/g, "ゼ" );
str = str.replace( /ソﾞ/g, "ゾ" );

　～～～以下同じ感じで続くので省略～～～

return str;
}

・・・ここにコピペして項目移動したり、余白クリックしたときに勝手に変換されます。

この記事にはなんのコメントも付いておりません。

** Caution!! For non-Japanese speaking people ** original page is written in Japanese only. If you view this page via a translation site, you may not be able to accurately convey the nuances we intend.

■Unicode に揃えるのが基本ですよってのは理解しているんです。

■Unicodeの怪現象。カタカナの濁音/半濁音の例外処理。

Caution!! For non-Japanese speaking people
　original page is written in Japanese only.
　If you view this page via a translation site, you may not be able to accurately convey the nuances we intend.