Skip to content

Latest commit

 

History

History
441 lines (266 loc) · 22.3 KB

usage.md

File metadata and controls

441 lines (266 loc) · 22.3 KB
layout title
default
詳しい使い方

詳しい使い方

logaling-command を使うための準備をする

まずは logaling-command をインストールします。 logaling-command は RubyGems でインストールできます。

※logaling-command は Ruby 1.9 環境で動作します。

% gem install logaling-command

もし、以下のようなエラーメッセージが出てしまってインストールできないようであれば、それはあなたの環境が Ruby 1.8 だということなので、Ruby1.9.2をインストールしてから再度インストールしてみてください。

logaling-command requires Ruby version >= 1.9.2.
ERROR:  Error installing logaling-command:

インストールが成功したことを確認するには、コマンドラインで loga -v と打ってみてください。

% loga -v
logaling-command version 0.0.8

上記のようなバージョン情報が表示されたら、インストールは成功です。

※logaling-command は Ruby 1.9 環境で動作します。 また、内部では groonga、rroonga を利用しています。もしインストールされていなければ、 logaling-command をインストールすると同時に groonga と rroonga もインストールされます。

目次へ戻る

2. logaling-command を使う準備をする

プロジェクトに logaling-command を導入するための準備をします。

例えば、あなたが groonga というプロジェクトに関わっていて、そのリポジトリが /Users/suzuki/groonga に既に存在するとします。そして、そのプロジェクトで英語→日本語の用語集を作成したいとしましょう。その場合は、そのリポジトリのトップディレクトリで以下のコマンドを実行して下さい。( 新たに用語集は作らなくてもいい、既存の用語集をとりあえず使いたい、などという場合も、このコマンドを実行する必要があります。ただし、他プロジェクトの用語集から検索したいだけの場合はこの操作は必要ありません。)

% cd /Users/suzuki/groonga
% loga new groonga en ja
Your project is now registered to logaling.
Successfully created .logaling

loga new はプロジェクトで用語集を使うための設定ファイルやディレクトリなどを作成します。パラメータは「用語集名」と「原文の言語コード※1」「対訳の言語コード(省略可能)」をこの順番で指定します。用語集名は必ずしもプロジェクト名と同じでなくても構いません。ですが、後々プロジェクトを横断して検索を掛けたときにわかりやすくするためにも、プロジェクト名が分かるようにしておいたほうが良いでしょう。

さて、上記のコマンドを実行すると、 .logaling というディレクトリが作成されました。.logaling の中は次のようになっています。

.logaling
├── config
└── glossary

config はこのプロジェクト内で logaling-command を使うときの設定ファイルです。中身は次のようになっています。用語集名、原文の言語コード、対訳の言語コードが設定されています。

% cat .logaling/config
--glossary groonga
--source-language en
--target-language ja

glossary は、このプロジェクトの用語集を置くためのディレクトリです。現時点では何も用語集は置かれていません。

loga new は上記を行うと共に、ユーザーホームに .logaling.d/projects というディレクトリを作成し、そのディレクトリ配下にプロジェクトを登録します。

これで logaling-command を使うための準備が整いました。


※1言語の名称の略号2文字(ja や en など)http://ja.wikipedia.org/wiki/ISO_639

目次へ戻る

あなたが既に logaling-command を使用しているプロジェクトへ参加する場合、プロジェクトのリポジトリには .logaling というディレクトリが存在していると思います。(そのディレクトリの中に用語集があります。) その場合にあなたがすることは、あなたのホームディレクトリに logaling-command 用のディレクトリを作り、用語集を検索するための準備をすることだけです。

そのためには、以下のコマンドを実行します。

% loga register
Your project is now registered to logaling.

loga register を実行すると、データベースがなければ作成され、その中にプロジェクトが登録されます。

プロジェクトが登録されたかどうかは以下のコマンドで確認することができます。(ここでは、 groonga プロジェクトを例とします。)

% loga list
groonga

これで logaling-command を使うための準備が整いました。

目次へ戻る

logaling-command を使う

1. 用語を検索する

キーワードで用語集を検索してみましょう。 検索するには loga lookup <検索したいキーワード> とします。

% loga lookup patricia
patricia-trie    パトリシアトライ

既に用語集が存在していて、検索キーワードにマッチする用語が登録されていた場合は上記のような検索結果になります。 検索結果の見方は最初の「patricia-trie」が検索にマッチした用語、少し間をあけて次の「パトリシアトライ」が対訳です。 もしマッチした用語に備考が設定されていた場合には対訳の後ろにその内容が表示されます。 また、用語集が複数(プロジェクト分)ある場合には、最後にカッコ書きでマッチした用語集名が表示されます。 マッチした用語が複数ある場合は、これらのセットが複数表示されます。

目次へ戻る

logaling-command の lookup サブコマンドは、対訳用語集に登録されている用語の検索を目的としているため、用語が検索対象となっています。 けれど、edict や gene95 といった辞書をインポートして使用している場合など、 訳語からも検索できたり、設定している言語コードとは異なる対訳用語集からも検索をしたいといったこともあります。 そのような場合には --dictionary オプションを使用します。 --dictionary オプションを使用すると、原文だけではなく、訳文からも検索を行い、完全マッチしたものから順に結果出力します。 検索の優先度は、原文の完全一致 > 原文の部分一致 > 訳文の完全一致 > 訳文の部分一致 となっています。

% loga lookup インタフェース --dictionary
  インタフェース           (n) (comp) interface/  edict
    (中略)
  ユーザインタフェース     (n) (comp) user interface/  edict
  ユーザーインタフェース   (n) (comp) user interface/ edict
  INTERFACES            インタフェース(.Sh)[jpman,section4]   freebsd_jpman
  interface             インタフェース        postgresql_manual
  interface             インタフェース(インターフェース,インターフェイスでなく)[POSIX,kana]   freebsd_jpman
  terminal interface    端末インタフェース[POSIX]     freebsd_jpman

※--dictionary は --dict でも同様に動作します。

目次へ戻る

logaling-command は CUI ツールですが、テキストエディタから利用したい場合は多々あると思います。 そのような場合には、関連プロジェクト にある Emacs や Vim 、zsh などから logaling-command を利用できるツールを利用するか、あるいは自作することもあるかもしれません。 そういったツールで検索結果を扱う場合には検索結果が構造化されていてほしいものです。 そのような場合には --output オプションを使います。 lookup サブコマンド実行時に --output=csv (または、--output=json) をオプションとして指定することで、結果を指定した形式で出力することができます。

% loga lookup patricia --output=csv
  patricia-trie,パトリシアトライ,,en,ja

目次へ戻る

プロジェクトの対訳用語集に新たに用語を登録するには次のようにします。

% loga add "storage engine" "ストレージエンジン" "groongaをベースとしたMySQLのストレージエンジン"

用語を登録する際には loga add <用語> <対訳> <備考(省略可能)> とすると、そのプロジェクトの対訳用語集(なければ作成して)に用語を登録していくことができます。

用語集に登録されている用語のリストは loga show で確認することができます。

% loga show
now index groonga...
  storage engine    ストレージエンジン    #groongaをベースとしたMySQLのストレージエンジン

実際には用語集は YAML 形式のファイルで、loga add が最初に実行されると .logaling/glossary 以下に groonga.en.ja.yml というファイルが作成されます。これが logaling-command の用語集ファイルです。

% ls -l .logaling/glossary
total 16
-rw-r--r--  1 suzuki  suzuki  61 11 24 14:41 groonga.en.ja.csv
-rw-r--r--  1 suzuki  suzuki  99 11 24 15:14 groonga.en.ja.yml

試しに登録した内容を検索してみましょう。

% loga lookup storage
  storage engine    ストレージエンジン   # groongaをベースとしたMySQLのストレージエンジン

また、この用語登録はひとつの用語で複数の対訳を登録することが可能です。その場合も同じように loga add してください。

% loga add "storage engine" "ストレージ・エンジン"

結果を検索すると、次のようになります。

% loga lookup storage
now index groonga...
  storage engine    ストレージエンジン    # groongaをベースとしたMySQLのストレージエンジン
  storage engine    ストレージ・エンジン

目次へ戻る

一つのプロジェクトで複数言語への翻訳が同時に進行している場合には、プロジェクトのリポジトリに含める設定としての「翻訳言語(target-language)」を決めたくない場合があるかもしれません。 例えば、元のドキュメントは英語で、それを日本語とフランス語に翻訳したい。さらに、後から別の言語にも翻訳していく可能性があるような場合です。

そういう場合には、プロジェクトのトップレベルにある .logaling/config は以下のように --target-language が省略されているでしょう。

% cat .logaling/config
--glossary groonga
--source-language en

この状態で loga add しようとすると、

% loga add email Eメール
input target-language code '-T <target-language code>'

このように翻訳言語の言語コードを指定するようにメッセージが表示されて追加できません。 もちろん、1つの用語だけを用語集に追加したいだけなら、このメッセージ通りにオプションとして翻訳言語を指定することで問題なく追加することができます。 ですが、次々に用語を追加していきたい場合には毎回オプションで翻訳言語の言語コードを指定するのは面倒です。

そのような場合には loga config を利用します。

% loga config target-language ja --global
Successfully set config.

loga config [設定キー] [設定の値] --global とすると、プロジェクトの .logaling/config ではなく、ユーザーホームの .logaling.d/config という設定ファイルが書き換えられます(ファイルが無かった場合には作成され設定が記述されます)。

% ls -l ~/.logaling.d
total 8
drwxr-xr-x   5 suzuki  suzuki  170 12 14 15:11 cache
drwxr-xr-x  18 suzuki  suzuki  612 12 15 17:33 db
-rw-r--r--   1 suzuki  suzuki   61 12 16 15:38 config
drwxr-xr-x   4 suzuki  suzuki  136 12 15 17:33 projects

この設定はグローバルな設定となるので、どこの階層にいても参照されることになります。設定ファイルの中身は .logaling/config と同じですが logaling-command は実行時に、 コマンドラインオプション > プロジェクトごとの設定 > ユーザホームのグローバルな設定 という順序で設定を参照します。 .logaling.d/config に自分専用のグローバルな設定を持つことができるので、一つのプロジェクトで複数の言語への翻訳が同時進行していても普段と同じように用語集の編集ができるようになります。

loga config の使い方の詳細はコマンドリファレンスを参照して下さい。

目次へ戻る

用語を登録する際に typo してしまった、または別の対訳にして登録しなおしたいときは、用語集を編集することができます。 用語集を編集するには loga update <用語> <登録されている対訳> <新しい対訳> <新しい備考(省略可)> とします。

まずは編集したい用語を検索してみましょう。ここでは、先ほど登録した「storage engine」とします。

% loga lookup storage
  storage engine    ストレージエンジン    # groongaをベースとしたMySQLのストレージエンジン
  storage engine    ストレージ・エンジン

この、2つ目の対訳を「ストレージ エンジン」とすることにします。

% loga update "storage engine" "ストレージ・エンジン" "ストレージ エンジン" "ストレージとエンジンの間にスペース1つ"

結果を確認してみましょう。 % loga lookup storage

lookup word : storage
  storage engine    ストレージエンジン    # groongaをベースとしたMySQLのストレージエンジン
  storage engine    ストレージ エンジン   # ストレージとエンジンの間にスペース1つ

指定した通りに更新されました。

目次へ戻る

用語集に登録してある用語が必要なくなった場合にはloga delete <用語> <対訳> とすると、削除することができます。 [storage engine] - [ストレージ エンジン]という用語と対訳のペアを削除してみます。

% loga delete "storage engine" "ストレージ エンジン"

結果を確認してみましょう。 % loga lookup storage storage engine : ストレージエンジン # groongaをベースとしたMySQLのストレージエンジン

指定した通りに削除されました。

目次へ戻る

6. 用語集をインポートする

プロジェクトで既に「用語-対訳」のペアを用語集として何らかの形式で持っている場合があります。 logaling-command では、そのような場合のために、1行1用語ペアの CSV/TSV 形式を検索対象の用語集としてサポートしています。※2

例えば、下記のような対訳用語集がある場合、

% cat groonga.csv
patricia-trie,パトリシアトライ
hash,ハッシュテーブル

その用語集のファイル名に原文の言語コードと変換後言語コードを明示して .logaling/glossary へ置くことで検索対象の用語集にすることができるようになります。

% mv groonga.csv .logaling/glossary/groonga.en.ja.csv

実際に検索すると以下のような結果になります。

% loga lookup patricia
patricia-trie    パトリシアトライ

※2ファイルの文字コードはUTF-8のみに対応しています。

目次へ戻る

自分が参加しているプロジェクト以外で、同じ用語がどのように訳されているのかを知りたい場合があるかもしれません。 loga import で、いくつかの有名プロジェクトで利用されている用語集をインポートすることができます。

まずは、インポートできるプロジェクトの種類がどれくらいあるのかを知るために、以下のコマンドを実行して下さい。

% loga import --list
debian_project : Debian JP Project (http://www.debian.or.jp/community/translate/)
gnome_project : GNOME Translation Project Ja (http://live.gnome.org/TranslationProjectJa)
postgresql_manual : PostgreSQL7.1 Manual (http://osb.sraoss.co.jp/PostgreSQL/Manual/)

コマンドの結果から、インポート出来る用語集が3種類あることがわかりました。それでは、このうちの postgresql_manual をインポートしてみましょう。実際に用語集をインポートするためには loga import に用語集名をパラメータとして渡してあげます。この用語集名は上記のリストのコロンの前にある項目です。

% loga import postgresql_manual

これでインポートができたので、試しに検索してみましょう。

% loga lookup db
DBA        DBA         (postgresql_manual)

先ほどインポートした postgresql_manual から検索できました。

目次へ戻る

翻訳ツールなどを利用して翻訳を行なっている場合には、CSV や TSV だけでなく、TMX 形式で用語集を扱っているかもしれません。 そのような場合にも loga import tmx <用語集名> <url/path 原文の言語コード> <訳文の言語コード> で用語集をインポートすることができます。

例えば、TMX 形式の用語集ファイル groonga.tmx がカレントディレクトリにあるとします。その場合は以下のコマンドを実行することで用語集をインポートすることができます。

% loga import tmx groonga ./groonga.tmx en ja

ここで、最後の「原文の言語コード」と「訳文の言語コード」ですが、英語( en )→日本語( ja )をデフォルトとして扱うため、同様の言語コードの場合は省略できます。 ですので、上記コマンドは以下のように実行しても、同様の動作をします。

% loga import tmx groonga ./groonga.tmx

TMX 形式のファイルを指定するには、ローカルファイルのパスだけでなく、URL でも可能です。そのような場合でもコマンドパス指定と同様に以下のようになります。

% loga import tmx groonga http://example.com/groonga.tmx

目次へ戻る