2017年1月25日水曜日

ブログ移転しました

 ブログ移転しました。今後2017年からの活動は移転先のはてなブログで行いたいと思います。ブックマークなどをつけてくださっていた方は移転先に現在の記事をすべて移行しているのでそちらに変更をおねがいします。

移転先……つぐみの居所:移転先……つぐみの居所(はてなブログ)

移転先でも、よろしくおねがいします。

2016年12月23日金曜日

日本語入力を楽にする!マイナー配列のススメ かな配列編

 さて、今日のテーマは「マイナー配列を使ったことのない人、知らなかった人に配列を紹介する」の2回目、「かな配列編」です。
かな配列「編」ということは前回もあります。下のリンクからどうぞ。
日本語入力を楽にする!マイナー配列のススメ 行段系配列編


 日本語配列にはいろいろ種類があって、一般的なローマ字配列からかな打ち、中には漢字を直接(変換せずに!)打ち込むなんて方式まであったりします。それこそ多種多様。
 

 その中で、今回は「かな打ち」のための「かな配列」に焦点を当てて紹介していきたいと思います。

1.1 親指シフト

 親指シフト……別名「NICOLA」なんて言ったりもします。ローマ字などしか使ったことのない方は「親指シフト? 親指はスペースバーだろう」と考えるんじゃないでしょうか。もしかしたら印刷できる方のワープロを使っていた方には「懐かしいなぁ」と思う方もいるかもしれません。


 親指シフトとは、既存の配列(ワープロの時代なのでローマ字入力など)よりも高効率低負荷で入力することを目的として開発された配列です。大きな特徴は、「親指キー」を用いて、すべての仮名を「1動作」で行えるようにしていることです。

 1動作というのは、最低1キー、多くても文字キーと親指キーの2つのキーを同時に打つことで1動作、ということです。通常のかな入力ではシフト入力が必要だったり、ローマ字だったら最低2打鍵になりますが、それがすべて親指シフトでは1回の動作で収まります。


 また、多くの他の配列と違い、ローマ字入力やかな入力並みに「実績」のある入力配列です。1980年に親指シフトを搭載したワープロが登場して以来、今日まで根強く利用されている配列です。ワープロ専用機ではシェアの7割を占めていたという話もあります。

現実問題、30年以上前の設計ということで現在では他の配列と比べた時に劣る部分も出てきていますが、その実績からマイナー配列の中でも実装が多く、最も人気な傑作配列と言ってもいいでしょう。
 実装方法として、Windows環境だと「DvorakJ」や「やまぶきR」が主流です。最近はWindows10になってからいろいろ入力関係が変わったそうで、それに対応するための新たな実装も様々あるようです。開発した富士通公式では「Japanist」というものもありますが、これはすでに古い設計なので、おとなしくDvorakJ」などを使ったほうが良いと思われます。
 

 macOSでは「Lacaille」というソフトを使うことで実装が可能なようです。少し前までは「Karabiner」というソフトで対応できたようですが、macOSのアップデートにより使えなくなっている(現状では様子見状態)ようです。
 

 Ubuntuなどでは「Libkkc」というIMEで実装できるようです。こちらは日本語のドキュメントが少ないので、どうせなら開発に参加してLinux上での親指シフト環境に貢献しても良いかもしれません。


 親指シフトに関する詳細は以下のページなどで探してみてください。

公式ページ: http://nicola.sunicom.co.jp/thumb1.html
Wikipedia: https://ja.wikipedia.org/wiki/%E8%A6%AA%E6%8C%87%E3%82%B7%E3%83%95%E3%83%88

1.2 新JIS配列(JIS X 2004)

 よく「かな入力」と呼ばれていたり、キーボードの刻印に入っていたりするのは現在JIS登録されている「JIS X 6002」というもので、これはワープロ専用機の時代から様々な問題点が指摘されていました。更にそののち、親指シフトが登場したことによって決定的にJIS X 2002の存在価値がなくなるというような自体が発生します。

 そんな時に「親指シフトに負けず劣らず良い配列を新しいJIS規格にしよう!」ということで開発されたのがこの「JIS X 6004」、通称「新JIS配列」です。

 この新JIS配列、Wikipediaによると、
「実在の人間にとって無理なく・すばやく操作できる入力法を設計するために、女子大生7名を対象として延べ約380万文字分の指の運動特性の調査を行い、『数百万字クラスの大規模n-gramデータを、数百万打鍵クラスの大規模運動特性データによって仮想打鍵する』ことにより、無数に存在する配列候補から『各種の要求を満たす、評価の高い配列』を、現実的な設計期間で選び出せる設計手法を用いた」(一部要約)
 

というようなかんじで、おっそろしいほど膨大なデータを使い、それをコンピュータ上でシミュレーションすることで最適化された配列の原型を創りだしたというかなりすごい手間をかけて開発されたようです。

 実用上の特徴としては、親指シフトが1動作ですべての入力をしてスピード向上を目標にしたのに対し、新JIS配列はどちらかというと実用上いかに快適に使うかをメインとして開発されていることです。
そのため、「高頻度の文字は1打鍵、低頻度の文字は2打鍵、2打鍵の時は交互打鍵の効率、また前後の文字の連なりを元にして配置している」というところです。親指シフトに比べても遜色ない、負けず劣らずな配列になりました。さらに天声人語を元データにしていることもあり、熟語の連なりが考慮されて気持よく打てるということもあります。


 ただしなぜかJIS X 2003を廃止しなかったせいでワープロ機には「ローマ字入力・JIS X 200・親指シフト・JIS X 2004搭載」というような機種まで出てきてしまい、旧JIS配列に慣れていた人や親指シフトに習熟している人や新規でワープロを使う人などからシェアをうばうことはできず、1999年JIS規格から廃止されてしまいます。

  ああ哀しみの新JIS配列。なぜ旧JISではなくJIS X 2004を廃止したのか。あゝ無情。なんでこんな傑作配列が廃止されてしまったんだ。旧JISが廃止されれば今頃ローマ字入力で小指痛い打ちづらいと悩む人も相当減っていただろうに。


 というような悲劇の傑作新JIS配列ですが、現在では「Google日本語入力」(もしくはMozc)で実装することができます。さらにこの傑作新JIS配列は無駄になることはなく、後述の「月配列」にも受け継がれていきます。
 

 あとかなりWikipediaが詳しいです。やばいです。めっちゃ詳しいです。
Wikipedia:https://ja.wikipedia.org/wiki/%E6%96%B0JIS%E9%85%8D%E5%88%97

1.3 月配列系

 悲劇の傑作新JIS配列、JIS規格から廃止されていても、まだ見捨てられてはいませんでした。掲示板「2ちゃんねる」上で、不特定多数のユーザーがアイデアを出しあい、より良い配列を作り出すという一種のプロジェクトが進行している際、この新JIS配列に光が当たることになります。

 その2ちゃんねる上で生まれた配列が「月配列」です。正確には月配列という特定の配列は存在せず、使用者各個がそれぞれバージョンを作っているというスタイルです。
 

月配列系の主な特徴として、
  • 新JIS配列を元として、シフトキーではなく中指キーで前押しシフトにする(中指シフト)
  • そのため新JIS配列と同じように高頻度の文字は1打鍵、低い文字は交互2打鍵でうてる
  • さらに様々な派生があるので自分にあった配列が探せる
  • 月配列は通常キーボードの3段10キー合計30キーしか使わないため、指の移動範囲が少なく、実装が簡単
  • 月配列系を使っている人は多いので、Twitterなどで質問したりできる
  • 高効率低負荷のものすごくバランスの良い配列
などなど、主な特徴が多すぎる配列だったりします。基本的な特徴は新JIS配列から引き継いでいるところもあるので、基本ポテンシャルが高い配列群だったりします。


主なバージョンとして、「月配列2-263」が挙げられます。殆どの月配列はこの2-263式から派生していて、初めて月配列に触れる人にはこの方式をおすすめします。

他にも各ユーザーの私家版として「月配列Ux」や「月配列E」など、様々な種類があり、実装法もそれぞれのバージョンによります。

 Wikipediaのページがなかったのではてなキーワードのページを貼っておきます。これが結構いい感じに解説されていて結構参考になったりします。また、各私家版もあるので検索するのも非常に
効果的です。


はてなキーワード:http://d.hatena.ne.jp/keyword/%C2%B7%C3%AE%C3%87%C3%9B%C3%8E%C3%B3

1.4 新下駄配列

 私が知る限り通常の配列ではこの配列のスピードが最強だと思います。
 
 新下駄配列は親指シフトの同時入力と、月配列などで使われている「中指シフト」というようなシフトの考え方を取り入れた配列です。そのシフトの種類が

  • 中指シフト
  • 薬指シフト
  • 拗音シフト
  • その他同時押し
かなりあるわけです。この中で特筆すべきは拗音シフト

 拗音シフトとは、例えば「しゃ」とか「きょ」とかそういうものを1動作で打とうというシフトです。これによりほかの配列をスピード面で圧倒的に突き放しています。例えば「しゃ」と打つのに親指シフトでは2動作なのに対して、新下駄配列では1動作で済むわけです。そのため拗音を含めた、「音」を重視した配列になっています。

 ただこのスピード最強タイパー御用達な感じの新下駄配列でございますが、様々なシフトがあるがゆえに習得にはかなり時間がかかると思います。おそらく今まで紹介してきた諸配列の中でも一番時間がかかるのではないのでしょうか。

 しかしこの他の配列の追随を許さない圧倒的スピード、自然な「音」を打つ感覚で、まさに喋るように打てる配列、その一種の「最強さ」がこの新下駄配列の魅力なのでしょう。

詳細は作者様のページをご覧ください。新下駄配列の原型の下駄配列を完成させてから約4年、練りに練られて開発された配列です。通常のかな入力配列の中で、最も尖った配列を使いたい、とい
う方、ぜひ使ってください。素晴らしい世界が待っています。

新下駄配列を作りました:http://kouy.exblog.jp/13627994/

1.5 あとがき

 かな入力方式ってすごいです。もうここまで来ると趣味の範囲で選んで全く問題ありません。

どれも素晴らしい配列です。他にも様々な配列が存在しますが、個人的には月配列をおすすめします。おそらくこの記事で紹介した中で最もバランスが取れた配列群だと思います。

でも新下駄配列の音を元にした入力も捨てがたいし、親指シフトの普及性も捨てがたい。
 

 お好きなものをお使いください。どれも習熟した日には素晴らしい世界が待っていることでしょう。

2016年11月23日水曜日

日本語配列の効率と思考スピード

「出来のいい日本語配列をある程度習熟すると思考スピードのほうが実用上足かせになる」ということを思いついて、ツイッターで垂れ流してたものをまとめてみました。
 最近はツイッターをあんまり使ってなくて、ましてやこんな配列関係のことをやってる時は殆どなかったと思いながら書いてます。

  つぐみ配列、作って使って11ヶ月位立ちましたが、手に馴染んですごいです。自分のために作った配列なので当然といえば当然ですが、やっぱり結構いい線いってるんじゃないかなと思ったり。

自分で作るまで行かなくても、ローマ字入力で不満があるなんてときはマイナー配列とか、調べてみるといいかもしれません。

2016年11月13日日曜日

読みやすい文章の文字数?

もう冬です。前回更新が10月前くらいだったので1ヶ月半くらい立ってます。ブログ書きましょう。

 さて、私はブログ書いてる時に文字数をカウントしていて、大体1000文字以上になるように意識しています。特にこれといった理由はなく、SEO的には最低そのくらいあったほうがいいという話を聞いただけです。しかしある時文字数について考えてみたら、あれ1000文字もいらないんじゃないかと思い始めました。

何故か私はキーボードで文章を書くときは(特にメカニカルキーボードで書いてる時とか)少なくとも500文字くらいは書けるんですが、紙とペンで書くとまあまあダメで、キーボードで書く時と同じ内容でも原稿用紙1枚行かないくらいになってしまいます。ノートとかに手書きで書いて結構書いたと思ってもだいたい600文字くらいになるんです。

 通常のブログの平均的な文字数はどのくらいなのかわかりませんが、1000文字は原稿用紙2枚半、2000文字は原稿用紙4枚と考えてみると、結構な文字数ありますよね。何か専門的な記事かもしくは好きなブロガーでもなければそこまで文字数いらないんじゃないかと思います。

なにせ暇つぶしを兼ねることもあるブラウジングの中で、原稿用紙数枚に相当する量の文章を気軽に読むのは……ちょっと本格的に調べようと思っている人には通じるかもしれないけど暇つぶしで読む気にはならないかな、という感じだと思います。


 こう考えるきっかけはちょっと長い記事があるなと思って文字数測ってみたら1200文字くらいで、ありゃそんなに長くなくねと思ったことからです。
 

なんか個人的には文字数増やして(というか中身を増やして)書こうとする筆者と、あっさり読みたくなる読者としての違いなんてのもあるのかな、と思います。

 じゃどういうくらいがいいのか……というと読む人によるという結論に至るしかないのですがね。必要な情報を求める時しかこういう記事を覗かない、ディープな情報がほしい、という人が来るような記事はそれだけ内容をこく(文字数を多く)しなければならないでしょうし、軽く暇つぶしなどに気軽に読める記事を書きたいという時はあっさりとした感じでいいと思います。

このブログの場合は(配列関係などのことはともかく)基本あまり内容が濃くないので、あっさりした、少なめの文字数のほうが読みやすいのかな……と思います。


 というこの記事の文字数は約1000文字です。ありがとうございました。

2016年9月25日日曜日

紙のアナログ回帰とデータのデジタル管理

  9月も過ぎ、あっという間に秋になっていく、そんな中夏のはじめから更新していなかった、やっと書くよh2tです。

 夏、終わりつつあります。残暑もずいぶん収まり、夜も長くなってきました。あっという間に秋。
夏の間、私は何をしていたかというと、アナログに目覚め始めました。というかデジタルから離れて行きました。

アナログ回帰しつつある

アナログ回帰、どういうことかというと、つまり紙に戻ったのです。
具体的には、パソコン上のEmacsでとっていたメモは「情報カード」に、Emacs上のOrg-modeで管理していた日記やアイデアは「ノート」や「情報カード」になりました。

 なんでEmacsから離れたか、なんでスマホなどを使わず紙というアナログな方法に戻ったのか。
簡単です。それは「楽」だから。

 私は常時スマートフォンを持ち運ぶわけではないし、ましてやEmacsを使って一日中パソコンの前に入るわけではない。そんな簡単なことがきっかけになりました。

 100均で見つけた「情報カード」というものの活用法を調べていたら、PoICというライフハック的メモ術に行き着き、そこからだんだんとデジタルで管理していた物を、アナログへ移していったのです。

デジタルじゃだめなの?

 じゃあデジタルに不満はなかったの?と聞かれると、はい、ほとんどありませんでしたと答えるほかありません。Emacsのスケジュール管理やorg-modeの管理のしやすさは文句ありませんし、すぐにパソコンをサワれる時なら非常に便利です。見やすいし、変更もしやすい。

 でも、私は24時間睡眠時間と食事以外パソコンの前に座っているような人ではありませんし、歩きもすれば出掛けもします。スマートフォンはフリック入力使いづらい。そう思うからアナログに回帰しているわけです。

結局はどっちでもいい

 いま仕事でパソコン使ってて、ほとんどの時間はパソコンの前にいる、という場合や、スマートフォンやタブレットで時間や生活を管理したりするのに抵抗がない、という場合はデジタルは便利でしょう。というかデジタルのほうが便利です。

 しかし、私は思いの外デジタルと離れていた。ただそれだけです。
でも、一度入ると沼ですよ。デジタルでも対して変わりませんが。
 





  やはりパソコンやスマートフォンなどと離れない生活をしているならデジタルのほうが確実に便利です。しかし、アナログでも大抵のことはできるし、可搬性はアナログのほうが高い。

たまには、アナログ方式を見なおしてみませんか?

2016年7月10日日曜日

漢字直接入力は何なのか。もしくは漢直おすすめという話。


 世の中物好きというのはいるものです。シャープペンシル全盛の時代に鉛筆を使ったり、Windowsがシェア9割を占めている時にわざわざシェア2%満たないほどのLinuxに移ったりしている人が。誰か。ええ私です。

 そんな私が開発したつぐみ配列には「漢字直接入力」(俗に言う漢直)が搭載されています。

 定義しましょう。ここでいう漢直とは、変換なしで漢字とかなを打ち分けることができることができる配列です。例えば漢字変換を利用した打ち分け(例えば、「かん1」で変換すると「漢」が出力され、「かん2」変換で「間」が出力されたりするようなもの)は今回話題にしません。あまりつかったことないので。

 さて、その漢直ですが、その主な特徴に「日本語入力が楽になる」ということが挙げられます。

 これどう言うことかというと、一般的にタイピングの速度を早めたりするのはカナ系配列(JIS仮名、月配列、親指シフトなど)が用いられますが、ああいうのはあくまで変換ありきで作られているのですよ。

 ああいう配列は、かなしか入力できない。どうやっても今の漢字が多数存在している日本語文において、変換なしで入力することは不可能に等しいのです。

 だからこそ、かな系の配列は変換にかかる時間も視野に入れて、その文を「かなのみで」書いた時に最速となるように設計されているのがほとんどです。言うなれば、キーボードからの入力が「話すこと」に近づく配列群と言いましょうか。

 対して漢直、これは「文」を「書く」ことに特化した配列です。紙にペンで文章を書いていくのと同じように、画面にキーボードで「文」を「書く」ことができるのです。

 例を上げましょう。以下の文を漢字かな交じり分で入力してみてください。

「記者が貴社に汽車で帰社した」

かなに直してみましょう。

「きしゃがきしゃにきしゃできしゃした」

このかな文字列を、1度で完全に変換しきれたでしょうか?私の環境では無理でした。

 しかし、この文字列、紙にペンで書くときににいちいち、ひらがなで書いてそこを消して漢字に直していくでしょうか。しませんよね。漢直というのは文字の完全な打ち分けができますから、この紙にペンで書く感覚をいとも容易く再現できるのです。

 もちろんデメリットもあります。打ち分けができるということはそれだけ覚えなくてはいけないということ。多いものだと約3000個でしょうか。

しかし、それを抜ければキーボードでストレスのない、純粋な「書く」感覚を手に入れることができるのです。漢直のメリットはそこです。打鍵数が減るとか、打ち分けができるというのは全てそのためなのです。

 さて、漢字直接入力が使える配列は一体どのくらいあるのでしょう。以下に少し並べてみましょう。
  • T-Code ……元祖(無連想式)漢直。効率に特化したストイックなプロ向けな配列。
  • TUT-Code ……あまりにストイックなT-Codeをマイルドにして漢字数増やした配列。
  • G-Code ……覚えやすいT-Code、打ちやすいTUT-Codeを目指して作られた配列。
  • Phoenix ……打ちやすい、疲れない、覚えやすい漢直を目指して作られた配列。
  • つぐみ配列 ……私が開発した、書くことに近づける配列。
一例を上げてみました。他にもくぐってみてください。いろいろありますよ。

この記事を読んだ方、ぜひ、1度調べて、使ってみてください。世界が広がるかもしれませんよ。

2016年6月30日木曜日

[つぐみ配列開発記]つぐみ配列第一弾公開と漢直欲[#3]


 気付いたら前回の更新から1ヶ月経っててあせってるh2tです。前回の更新からつぐみ配列も色々変わりまして、今では濁音後付け版を試作していたりします。

 さて前回の続きです。ある程度つぐみ配列の原型も出来まして、さあ公開しようかという時の話と、唐突に出てきた漢直欲の話。

 つぐみ配列の形もある程度決まり、さあ公開しようかという時に、あるものを唐突に思い出してしまいました。
「そういえばこまどり配列に漢字を直接打てる定義あったよな……あれ使いこなせれば変換のストレスから開放されるんじゃね?」
こまどり配列には、いくつか変換なしで入力できる定義がありました。これは作者様のサイトに詳しいことが書いてあります。

こまどり配列の漢字入力部分などについての記事

そこから色々調べていくと、「漢直」なるものが私の考えていることを実現した配列群だということがわかりました。T-CodeとかTUT-CodeとかG-CodeとかPhoenixとかですね。

これがまたすごくて、この漢直というものに非常に憧れを抱いてしまいました。
 そこでまず、一度漢直部分を含まない仮名部分だけのつぐみ配列を公開して(確か当時はつぐみ配列Ver.1とか呼称してたと思う)、漢直をどうにかして搭載できないかと考えました。
どう考えても当時の私が3時間程度で立派な漢直を作るのは不可能なので、どこからか漢直部分を借りようかと。
シフトキーでシフトすればT-CodeやTUT-Codeなどを実装することはできるので、借りる漢直に悩みました。
 単純に1ストローク増えるので、できるだけストローク数は少ないほうがいい。
4ストローク5ストロークもかかっていたらまともに入力できるわけがないと思い、候補に上がったのはT-Code。無連想式漢直の始祖に当たる配列です。搭載している文字は2000文字弱、全て2ストロークで入力できる代わりに仮名でさえ無連想で入力しなければいけないストイックな配列です。
 かな部分の問題はつぐみ配列の仮名で解決できるので、あとは搭載するのみ。搭載したつぐみ配列は「つぐみ配列Ver2」とか言って公開しました。
 その後TwitterでのやりとりからT-Code側のかな定義を削除したり、カタカナも打てるようにしたりして、ここで初めて今のつぐみ配列のような、「仮名」+「カタカナ」+「漢字」の3つが揃った配列が出来上がったわけです。ここまでで作り始めてから約2週間かな?
 今回はこれで終わります。次回は……そうですね、自作漢直部分の話でも書きましょうか。