layout | title |
---|---|
default |
詳しい使い方 |
- logaling-command をインストールする
- logaling-command を使う準備をする
まずは logaling-command をインストールします。 logaling-command は RubyGems でインストールできます。
※logaling-command は Ruby 1.9 環境で動作します。
% gem install logaling-command
もし、以下のようなエラーメッセージが出てしまってインストールできないようであれば、それはあなたの環境が Ruby 1.8 だということなので、Ruby1.9.2をインストールしてから再度インストールしてみてください。
logaling-command requires Ruby version >= 1.9.2.
ERROR: Error installing logaling-command:
インストールが成功したことを確認するには、コマンドラインで loga -v
と打ってみてください。
% loga -v
logaling-command version 0.0.8
上記のようなバージョン情報が表示されたら、インストールは成功です。
※logaling-command は Ruby 1.9 環境で動作します。 また、内部では groonga、rroonga を利用しています。もしインストールされていなければ、 logaling-command をインストールすると同時に groonga と rroonga もインストールされます。
プロジェクトに logaling-command を導入するための準備をします。
例えば、あなたが groonga というプロジェクトに関わっていて、そのリポジトリが /Users/suzuki/groonga に既に存在するとします。そして、そのプロジェクトで英語→日本語の用語集を作成したいとしましょう。その場合は、そのリポジトリのトップディレクトリで以下のコマンドを実行して下さい。( 新たに用語集は作らなくてもいい、既存の用語集をとりあえず使いたい、などという場合も、このコマンドを実行する必要があります。ただし、他プロジェクトの用語集から検索したいだけの場合はこの操作は必要ありません。)
% cd /Users/suzuki/groonga
% loga new groonga en ja
Your project is now registered to logaling.
Successfully created .logaling
loga new はプロジェクトで用語集を使うための設定ファイルやディレクトリなどを作成します。パラメータは「用語集名」と「原文の言語コード※1」「対訳の言語コード(省略可能)」をこの順番で指定します。用語集名は必ずしもプロジェクト名と同じでなくても構いません。ですが、後々プロジェクトを横断して検索を掛けたときにわかりやすくするためにも、プロジェクト名が分かるようにしておいたほうが良いでしょう。
さて、上記のコマンドを実行すると、 .logaling というディレクトリが作成されました。.logaling の中は次のようになっています。
.logaling
├── config
└── glossary
config はこのプロジェクト内で logaling-command を使うときの設定ファイルです。中身は次のようになっています。用語集名、原文の言語コード、対訳の言語コードが設定されています。
% cat .logaling/config
--glossary groonga
--source-language en
--target-language ja
glossary は、このプロジェクトの用語集を置くためのディレクトリです。現時点では何も用語集は置かれていません。
loga new は上記を行うと共に、ユーザーホームに .logaling.d/projects というディレクトリを作成し、そのディレクトリ配下にプロジェクトを登録します。
これで logaling-command を使うための準備が整いました。
※1言語の名称の略号2文字(ja や en など)http://ja.wikipedia.org/wiki/ISO_639
あなたが既に logaling-command を使用しているプロジェクトへ参加する場合、プロジェクトのリポジトリには .logaling というディレクトリが存在していると思います。(そのディレクトリの中に用語集があります。) その場合にあなたがすることは、あなたのホームディレクトリに logaling-command 用のディレクトリを作り、用語集を検索するための準備をすることだけです。
そのためには、以下のコマンドを実行します。
% loga register
Your project is now registered to logaling.
loga register を実行すると、データベースがなければ作成され、その中にプロジェクトが登録されます。
プロジェクトが登録されたかどうかは以下のコマンドで確認することができます。(ここでは、 groonga プロジェクトを例とします。)
% loga list
groonga
これで logaling-command を使うための準備が整いました。
キーワードで用語集を検索してみましょう。
検索するには loga lookup <検索したいキーワード>
とします。
% loga lookup patricia
patricia-trie パトリシアトライ
既に用語集が存在していて、検索キーワードにマッチする用語が登録されていた場合は上記のような検索結果になります。 検索結果の見方は最初の「patricia-trie」が検索にマッチした用語、少し間をあけて次の「パトリシアトライ」が対訳です。 もしマッチした用語に備考が設定されていた場合には対訳の後ろにその内容が表示されます。 また、用語集が複数(プロジェクト分)ある場合には、最後にカッコ書きでマッチした用語集名が表示されます。 マッチした用語が複数ある場合は、これらのセットが複数表示されます。
logaling-command の lookup サブコマンドは、対訳用語集に登録されている用語の検索を目的としているため、用語が検索対象となっています。 けれど、edict や gene95 といった辞書をインポートして使用している場合など、 訳語からも検索できたり、設定している言語コードとは異なる対訳用語集からも検索をしたいといったこともあります。 そのような場合には --dictionary オプションを使用します。 --dictionary オプションを使用すると、原文だけではなく、訳文からも検索を行い、完全マッチしたものから順に結果出力します。 検索の優先度は、原文の完全一致 > 原文の部分一致 > 訳文の完全一致 > 訳文の部分一致 となっています。
% loga lookup インタフェース --dictionary
インタフェース (n) (comp) interface/ edict
(中略)
ユーザインタフェース (n) (comp) user interface/ edict
ユーザーインタフェース (n) (comp) user interface/ edict
INTERFACES インタフェース(.Sh)[jpman,section4] freebsd_jpman
interface インタフェース postgresql_manual
interface インタフェース(インターフェース,インターフェイスでなく)[POSIX,kana] freebsd_jpman
terminal interface 端末インタフェース[POSIX] freebsd_jpman
※--dictionary は --dict でも同様に動作します。
logaling-command は CUI ツールですが、テキストエディタから利用したい場合は多々あると思います。 そのような場合には、関連プロジェクト にある Emacs や Vim 、zsh などから logaling-command を利用できるツールを利用するか、あるいは自作することもあるかもしれません。 そういったツールで検索結果を扱う場合には検索結果が構造化されていてほしいものです。 そのような場合には --output オプションを使います。 lookup サブコマンド実行時に --output=csv (または、--output=json) をオプションとして指定することで、結果を指定した形式で出力することができます。
% loga lookup patricia --output=csv
patricia-trie,パトリシアトライ,,en,ja
プロジェクトの対訳用語集に新たに用語を登録するには次のようにします。
% loga add "storage engine" "ストレージエンジン" "groongaをベースとしたMySQLのストレージエンジン"
用語を登録する際には loga add <用語> <対訳> <備考(省略可能)>
とすると、そのプロジェクトの対訳用語集(なければ作成して)に用語を登録していくことができます。
用語集に登録されている用語のリストは loga show
で確認することができます。
% loga show
now index groonga...
storage engine ストレージエンジン #groongaをベースとしたMySQLのストレージエンジン
実際には用語集は YAML 形式のファイルで、loga add
が最初に実行されると .logaling/glossary 以下に groonga.en.ja.yml というファイルが作成されます。これが logaling-command の用語集ファイルです。
% ls -l .logaling/glossary
total 16
-rw-r--r-- 1 suzuki suzuki 61 11 24 14:41 groonga.en.ja.csv
-rw-r--r-- 1 suzuki suzuki 99 11 24 15:14 groonga.en.ja.yml
試しに登録した内容を検索してみましょう。
% loga lookup storage
storage engine ストレージエンジン # groongaをベースとしたMySQLのストレージエンジン
また、この用語登録はひとつの用語で複数の対訳を登録することが可能です。その場合も同じように loga add してください。
% loga add "storage engine" "ストレージ・エンジン"
結果を検索すると、次のようになります。
% loga lookup storage
now index groonga...
storage engine ストレージエンジン # groongaをベースとしたMySQLのストレージエンジン
storage engine ストレージ・エンジン
一つのプロジェクトで複数言語への翻訳が同時に進行している場合には、プロジェクトのリポジトリに含める設定としての「翻訳言語(target-language)」を決めたくない場合があるかもしれません。 例えば、元のドキュメントは英語で、それを日本語とフランス語に翻訳したい。さらに、後から別の言語にも翻訳していく可能性があるような場合です。
そういう場合には、プロジェクトのトップレベルにある .logaling/config は以下のように --target-language が省略されているでしょう。
% cat .logaling/config
--glossary groonga
--source-language en
この状態で loga add しようとすると、
% loga add email Eメール
input target-language code '-T <target-language code>'
このように翻訳言語の言語コードを指定するようにメッセージが表示されて追加できません。 もちろん、1つの用語だけを用語集に追加したいだけなら、このメッセージ通りにオプションとして翻訳言語を指定することで問題なく追加することができます。 ですが、次々に用語を追加していきたい場合には毎回オプションで翻訳言語の言語コードを指定するのは面倒です。
そのような場合には loga config を利用します。
% loga config target-language ja --global
Successfully set config.
loga config [設定キー] [設定の値] --global
とすると、プロジェクトの .logaling/config ではなく、ユーザーホームの .logaling.d/config という設定ファイルが書き換えられます(ファイルが無かった場合には作成され設定が記述されます)。
% ls -l ~/.logaling.d
total 8
drwxr-xr-x 5 suzuki suzuki 170 12 14 15:11 cache
drwxr-xr-x 18 suzuki suzuki 612 12 15 17:33 db
-rw-r--r-- 1 suzuki suzuki 61 12 16 15:38 config
drwxr-xr-x 4 suzuki suzuki 136 12 15 17:33 projects
この設定はグローバルな設定となるので、どこの階層にいても参照されることになります。設定ファイルの中身は .logaling/config と同じですが logaling-command は実行時に、 コマンドラインオプション > プロジェクトごとの設定 > ユーザホームのグローバルな設定 という順序で設定を参照します。 .logaling.d/config に自分専用のグローバルな設定を持つことができるので、一つのプロジェクトで複数の言語への翻訳が同時進行していても普段と同じように用語集の編集ができるようになります。
loga config の使い方の詳細はコマンドリファレンスを参照して下さい。
用語を登録する際に typo してしまった、または別の対訳にして登録しなおしたいときは、用語集を編集することができます。
用語集を編集するには loga update <用語> <登録されている対訳> <新しい対訳> <新しい備考(省略可)>
とします。
まずは編集したい用語を検索してみましょう。ここでは、先ほど登録した「storage engine」とします。
% loga lookup storage
storage engine ストレージエンジン # groongaをベースとしたMySQLのストレージエンジン
storage engine ストレージ・エンジン
この、2つ目の対訳を「ストレージ エンジン」とすることにします。
% loga update "storage engine" "ストレージ・エンジン" "ストレージ エンジン" "ストレージとエンジンの間にスペース1つ"
結果を確認してみましょう。 % loga lookup storage
lookup word : storage
storage engine ストレージエンジン # groongaをベースとしたMySQLのストレージエンジン
storage engine ストレージ エンジン # ストレージとエンジンの間にスペース1つ
指定した通りに更新されました。
用語集に登録してある用語が必要なくなった場合にはloga delete <用語> <対訳>
とすると、削除することができます。
[storage engine] - [ストレージ エンジン]という用語と対訳のペアを削除してみます。
% loga delete "storage engine" "ストレージ エンジン"
結果を確認してみましょう。 % loga lookup storage storage engine : ストレージエンジン # groongaをベースとしたMySQLのストレージエンジン
指定した通りに削除されました。
プロジェクトで既に「用語-対訳」のペアを用語集として何らかの形式で持っている場合があります。 logaling-command では、そのような場合のために、1行1用語ペアの CSV/TSV 形式を検索対象の用語集としてサポートしています。※2
例えば、下記のような対訳用語集がある場合、
% cat groonga.csv
patricia-trie,パトリシアトライ
hash,ハッシュテーブル
その用語集のファイル名に原文の言語コードと変換後言語コードを明示して .logaling/glossary へ置くことで検索対象の用語集にすることができるようになります。
% mv groonga.csv .logaling/glossary/groonga.en.ja.csv
実際に検索すると以下のような結果になります。
% loga lookup patricia
patricia-trie パトリシアトライ
自分が参加しているプロジェクト以外で、同じ用語がどのように訳されているのかを知りたい場合があるかもしれません。 loga import で、いくつかの有名プロジェクトで利用されている用語集をインポートすることができます。
まずは、インポートできるプロジェクトの種類がどれくらいあるのかを知るために、以下のコマンドを実行して下さい。
% loga import --list
debian_project : Debian JP Project (http://www.debian.or.jp/community/translate/)
gnome_project : GNOME Translation Project Ja (http://live.gnome.org/TranslationProjectJa)
postgresql_manual : PostgreSQL7.1 Manual (http://osb.sraoss.co.jp/PostgreSQL/Manual/)
コマンドの結果から、インポート出来る用語集が3種類あることがわかりました。それでは、このうちの postgresql_manual をインポートしてみましょう。実際に用語集をインポートするためには loga import に用語集名をパラメータとして渡してあげます。この用語集名は上記のリストのコロンの前にある項目です。
% loga import postgresql_manual
これでインポートができたので、試しに検索してみましょう。
% loga lookup db
DBA DBA (postgresql_manual)
先ほどインポートした postgresql_manual から検索できました。
翻訳ツールなどを利用して翻訳を行なっている場合には、CSV や TSV だけでなく、TMX 形式で用語集を扱っているかもしれません。
そのような場合にも loga import tmx <用語集名> <url/path 原文の言語コード> <訳文の言語コード>
で用語集をインポートすることができます。
例えば、TMX 形式の用語集ファイル groonga.tmx がカレントディレクトリにあるとします。その場合は以下のコマンドを実行することで用語集をインポートすることができます。
% loga import tmx groonga ./groonga.tmx en ja
ここで、最後の「原文の言語コード」と「訳文の言語コード」ですが、英語( en )→日本語( ja )をデフォルトとして扱うため、同様の言語コードの場合は省略できます。 ですので、上記コマンドは以下のように実行しても、同様の動作をします。
% loga import tmx groonga ./groonga.tmx
TMX 形式のファイルを指定するには、ローカルファイルのパスだけでなく、URL でも可能です。そのような場合でもコマンドパス指定と同様に以下のようになります。
% loga import tmx groonga http://example.com/groonga.tmx