ワード数算出方法

日英翻訳訳出ワード数 算出方法

JTSでは、日英翻訳(日本語から英語への翻訳)の訳出ワード数を算出 する際、MS-Wordその他のワープロソフトのワードカウント機能を使っておりません。訳文ファイルをテキスト形式で保存し、その バイト数を6で割った数値をワード数としています。

具体的な手順は次のとおりです。

  1. ファイルから無駄なスペース※ 1を取り除く。
  2. ASCII/ANSIテキストファイル※ 2として保存する。
  3. 2.のテキストファイルのバイト数を6で割って ワード数を算出する。

印刷業界では昔から「1ワード(5文 字)+それに続くスペースまたは句読点(詳細は後述)=6文字」が目安として使われており、JTSでも6文字を1ワード としてカウントしているのです。

一貫性と透明性を保証するために、弊社ではすべての翻訳者、編集 者、お客様に対して、このワード数算出方法を採用しています。JTSの支払いまたは請求のベースとなったワード数についてご質問のある 方はJTSまでご連絡ください。ワード数算出に使用したテキストファイルをお送りいたします。

ワープロソフトのワードカウント機能を使わない理由

では、なぜJTSがワー プロソフトのワードカウント機能を使わず、上述のような方法をとっているのか、その理由をご説明しましょう。

ワープロ ソフトは、それぞれ異なったワードカウントのアルゴリズムを使っています。たとえば、同じMS-WordでもWord 3.1、Word95/97/98/2000/2003/2007など、バージョンが違うとアルゴリズムも異なりま す。そのため、異なるソフト/バージョンで同一ファイルのワードカウントを見ると、ワード数が異なるという事態が発生します。

一方、 ファイルをテキストファイルに変換して保存した場合、異なるワープロソフトのファイルでもそのバイト数はほぼ同数になります。バイト数の誤差は2~4バイト程 度に過ぎず、6バイト を1ワード とするカウント方法では、最終的なワード数に影響を及ぼしません(少なくとも弊社での実験ではそのような結果が出ました)。したがって、このワード数算出 方法を使えば、使用アプリケーションが何であれ、ほぼ同じワード数を得ることができるのです。

JTSの算出方法によるワード数とMS-Wordのワード数の差

JTSでは数ヵ月間にわたって、上記の算出方法によるワード数とMS-Wordのワード数の差を調べましたが、一貫した数値は得られませんでし た。両者のワード数の差は3%から24%と大きく変動し、平均すると8~10%の 差が見られました。数字や特殊な記号を多く含むファイルの場合差が大きく、テキスト中心のファイルの場合や、ファイルが大きくなるにつれて差が小さくなる 傾向がありますが、その他のパターンは確認できませんでした。ちなみに、JTSのワードカウント方法は一貫してMS-Wordよりも高いワード数となっています。(非常に大きなファイルではこの現象が逆転することがありますが、今までは経験したことがあ りません。)

PowerPointやExcel、その他ワープロソフト以外のアプリケーションによる納品 ファイルの訳出ワード数算出方法

PowerPointやExcelにもワードカウント機能がありますが、テキストボックス内のテキス トはカウントされません。また、ワープロソフトと同様の問題もあるものと思われます。そこで、一貫性を維持するために、ワープロソフト以外のアプリケー ション・ファイルについても、テキストファイルを基にしたワード数算出方法を採用しています。PowerPointやExcelなどのフォーマットによる納品ファイルはテキストファイルに落と し、そのテキストファイルのバイト数からワード数を算出します。

Excelファイルの場合は、シートをWordにコピーして表を解除し、これをテキストファイルに変換します。テ キストボックス内に入力されたものもすべて、一般のテキストとしてWordファイルに落とします。

PowerPointの場合は、マクロを使ってファイルの文字内容をすべてWordに移し、Wordファイルの場合と同じ要領でテキストファイルに落としそのバイト 数を6で割って、ワード数を算出します。

このワード数算出方法を採用してきて

JTSでは1992年 の創立以来、主なワープロソフトとしてMS-Wordを使用する以前からずっと、この「6バイト=1ワー ド」方式を採用してきました。この方式については、私(ジム・ロックハート)が1986年に別の翻訳会社に在籍していたときに知り、以来この方式を使っ ています。当時は、どのファイルもASCIIテキストファイルの形で納品されていました。

これまで、この訳出ワード数算出方法についてJTS外 注先やお客様から特に大きな苦情をいただいておりません。また、この方法をご説明してもなお他のワード数算出方法を使うようにと要請してこられた方もおり ません。初めてのお客様には、日英翻訳料金はワード数に基づいており、翻訳編集過程における最も大きいファイルから作成した、余分な空白・改行などを除い たテキストファイルを基に、6バイトを1ワードとすることをご説明しています。

JTSの訳 出ワード数算出方法についてご質問・ご意見がございましたら、弊社までご連絡ください。


1.「無駄なスペース」とは、文書に不可欠なもの以外のスペースキャラクタ(空白、タブ、改行文字)です。文書中のダブル・スペー ス、ダブル・タブ、ダブル改行はすべて、一個のスペース/タブ/改行文字に変更し、改行の直前に入れられたスペースとタブを削除します。(本文に戻る)

2.Windows XPおよびWord 2002以降のバージョンでは、ファイルは「Windows default」、「文字の置換を認め る(A)」を使用、または「その他(O): 西ヨーロッパ (Windows)」、「文字の置換を認める(A)」を使用せず、という設定で保存します。「MS-DOS」、「文字の置換を認める(A)」を使用、またはUS-ASCIIファイルという設定で保存しても通常同じ結果が得られますが、その他の設定によってはややワード数が多くなります。(本文に戻る)

©1996–2019, Japan Translation Services. All rights reserved.