2013年4月3日水曜日

SimplyTerms:書式が設定された文章を扱う

秀丸等のテキストエディタで翻訳作業を行う場合、太字斜体字、上付き文字、下付き文字などが扱えないという短所があります。(例えば、Wordファイルで太字斜体字、上付き文字、下付き文字などがあり、その文章を秀丸にコピー&ペーストした場合、秀丸ではこれらの文字修飾(書式)は保持されず、普通の文字になります。)
しかし、翻訳をしていると、例えばCO2(二酸化炭素。2が下付き文字)やEscherichia coli(大腸菌)、Nipponia nippon(トキ)といった、化学式や生物の学名などで、下付き文字や斜体字が出てきますし、また、語句を強調するために、太字下線が使われることもよくあります。

書式は保持したい、でも動作が軽快な秀丸で作業をしたい。そういうときには、SimplyTerms(ST)を使えば、これらの書式の情報を保持したままテキストを抽出し、秀丸で翻訳後、Officeファイルに書き戻すと同時に自動で書式を設定することができます。

具体的な手順は以下の通りです。

まずは、準備としてSTの設定をします。
STを起動し、[ツール]→[オプション...]を開き、[テキスト抽出]タブの[MsOffice製品からのテキスト抽出項目]の[書式タグ]にチェックを付けます。(STの設定終わり)

この設定後、Officeファイルからテキストを抽出すると、太字斜体字、上付き文字、下付き文字など書式設定された文字がST独自の「書式タグ」で挟まれて抽出されます。
上付き文字:<sup>対象文字</sup>
下付き文字:<sub>対象文字</sub>
太字    :<b>対象文字</b>
斜体字   :<i>対象文字</i>
下線     :<u>対象文字</u>
※「書式タグ」はすべて半角の英字。
上の方で挙げたものは、CO<sub>2</sub>、<i>Escherichia coli</i>、<i>Nipponia nippon</i>というふうに抽出されます。他にも、6.02×10<sup>23</sup>(アボガドロ数。上付き文字の例)、Li<sub>1+x+y</sub>Al<sub>x</sub>Ti<sub>2-x</sub>Si<sub>y</sub>P<sub>3-y</sub>O<sub>12</sub>(x=0.3、y=0.2)(ガラスセラミック電解質。下付き文字が多数ある例)というように、「書式タグ」がついてなかったら数字や文字が連続してしまいよくわからなくなるものも、(多少見づらいかもしれませんが)秀丸で扱えるようになります。

翻訳するときには、このような「書式タグ」で挟まれて抽出された語句を「書式タグ」で挟んだまま翻訳(または、化学式や学名などはそのままコピー&ペースト)します。
そして、STで書き戻すときに、[抽出~書戻]タブの[処理内容]の四番目、[Officeテキスト書き戻し]を選択し、[書式タグ処理]を[あり]にして、書き戻します。

こうすることで、書式は保持しつつ動きが軽いテキストエディタで翻訳し、最終的にWordファイルを作ることができます。

※この「書式タグ」の処理は、[Officeテキスト書き戻し]と同時ではなく、別に行うこともできます([抽出~書戻]タブの[処理内容]の五番目、[Office書式タグ処理])。なので、翻訳に限らず、自分で何か文章を書くときにも、
秀丸で「書式タグ」をつけて文章を書く→Wordにコピー&ペースト→STで[Office書式タグ処理]→書式が設定されたWordファイルのできあがり!
というふうに利用できます。

ここで出てきた「書式タグ」は、毎回自分でポチポチ入力してもいいのですが、面倒ですし、入力ミスをする可能性があります。抽出した文からコピー&ペーストすれば入力間違いはなくなりますが、もっと簡単に「書式タグ」をつける方法があります。

同梱の秀丸マクロ「Ins_FormatTags」を使うのです。

例えば、「CO2」の「2」の部分を下付きの記号で挟みたい場合、「2」の部分を選択して「Ins_FormatTags」マクロを実行して[下付]を選択すると、「2」の前後に下付き文字用の「書式タグ」が挿入され、「CO<sub>2</sub>」となります。
私はこのマクロをよく使うので、キーボードのショートカットを割り当てて、簡単な操作で「書式タグ」を挿入できるようにしています。

この秀丸マクロについては後日また詳しく取り上げます。

0 件のコメント:

コメントを投稿