国境を超えるあなたを応援します
Linguistic assistance beyond borders

<めざせ語学マスター>文を分ける 文節&語&形態素

2021年6月30日

文を分ける


学校文法では、「文」を分ける方法を習います。例えば

「今日私は遅刻しました。」

という文を分けてみます。

「ネ」を入れてもおかしくなければ文節に分かれるそうなので、
「今日(ネ)、私は(ネ)、遅刻しました(ネ)。」
と文節にわけてみました。

さらに「語(単語)」にも分けてみます。
「今日、私 は 遅刻し まし た。」

学校では、
自立語(文節の最初に来る単語):今日 私 遅刻し 
付属語(つねに自立語のあとに付けて用いられる単語):は を まし た
という分け方をしています。

自立語はさらにいろんな品詞にわけられます。

名詞:
副詞:今日(今日という単語は名詞でもあり、副詞的用法もあるようで、今回は副詞)
動詞:遅刻する

付属語は助詞と助動詞に分けられます。
助詞:
助動詞:まし(なぜなら「まし」は「ませ」「ます」など活用する。)
    た(「た(だ)」も「たら」や「たろ」「だろ」と活用する)

ここまでだけで息切れしそうになります。

品詞マスターというiphone用アプリを使いました。このアプリ、学校文法と言語学的な解析を選べるんですね。すごい!・・でもどうしてここまで分ける必要があるのかちょっと疑問(;’∀’)。)

しかし、実はもっと分けられます。
ローマ字に分けたり、発音記号に変換したりすればさらにバラバラにできそうです。

Kyō, watashi wa chikoku o shimashita.

しかし、この一つ一つの発音([k]や[sh]など)に意味はありません。
そこで、意味のある区切りだけを残すところまでの分解にします。

今日(名詞) |(記号)| (名詞) | (助詞) | 遅刻(名詞) | (動詞)| まし(助動詞)| (助動詞)|(記号)」

「遅刻する」という動詞は「遅刻」と「する」に分けられてしまいました。
語と形態素の違いはなんでしょうか。
形態素とは「最小の記号」、もうそれ以上小さく区切ると意味を表すことができない単位だそうです。例えば「無遅刻無欠席」は一つの単語ですが、これも分解して、「無 | 遅刻 | 無|欠席」のようにわけます。限りなく意味として成立しそうなところまで分解していったものが形態素です。(ちなみに、言語は記号の体系だといって現代言語学の基礎を気づいたのはソシュール(1857-1913)です。)

形態素は英語でmorpheme。
単語(word)と形態素(morpheme)は違っていて、例えば複数形を表す単語についた「s」(chairs のs)は形要素になるので、ここには一つの単語の中に2つの形態素が入っていることになります。

さらに形態素は「内容形態素」と「機能形態素」に分かれます。
内容形態素(具体的な内容を示す形態素):今日 私 遅刻 し 
機能形態素(活用語尾のような文法的な機能を表す形態素):は を まし た

この「遅刻する」の「する」は「」となっていますが、他の「見る」や「食べる」などの動詞にある、活用しても変わらない語幹がありません。(「見(語幹)+る(語尾)」「食べ(語幹)+る(語尾)」)。しない、します、する、するとき、すれば、しろ、せよ、と「さしすせ」と変わるので「し」は「する」の異形態と呼ばれます。「はな(花)」は「草花(くさばな)」のように「バナ」になることもありますが、これも「はな」の異形態(allomorph)。

カエルがいっぴき、にひき、さんびき、よんひき・・・の「ぴき」「びき」なども「ひき」という助数詞「匹」の異形態。
似たような例としては、英語の複数形(s)にも、異形態素{s/z/ɪz}があります。 「hats」の[‘hæts]、「dogs」の[‘dɒgz]、「boxes」の[‘bɒksɪz]のように、実はそれぞれ発音が違っています。これも異形態と呼ぶそうです。

さらに、形態素にはそれだけで文章を作れる「自由形態素」、他の形態素と一緒に使われないといけない形態素を「拘束形態素」と呼びます。ひき、びき、ぴき、もそれだけだと何のこと?となるので拘束形態素です。それなら上の内容形態素(今日、私、遅刻、し)は全部自由形態素、機能形態素(は、を、まし、た)は全部構想形態素です。

いろいろありすぎてクラクラします。(だから合格しないのでしょうか。)

最近流行しているAI翻訳は、自然言語処理(Natural Language Processing)に基づいて行われています。「自然」だからと、勝手にファジーなイメージをもってはいけません。実際は、人間の言語(自然言語)を機械で処理し、内容を抽出するための処理で、AI様がきちんと作動させるためには、自然な言語を最小限の単位まで分解した大量のデータを用意する必要がある、という、恐ろしく機械的な作業です。私がここで説明するにはまだまだ知識が足りないので、詳しくは自然言語処理について書かれたサイト(https://ledge.ai/nlp/など)をご覧ください。ソシュールは、果たして彼の「記号論」がGOOGLEなどによってニューラル翻訳に生かされるなんて思っていたんでしょうか。もう少しソシュールについても調べてみたくなりました。

 

<<
>>

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です


最近のコメント

カテゴリー

月別アーカイブ

お気軽にご相談ください。
翻訳者・通訳者を募集しています。
お気軽にお問い合わせください。
サイト内検索
株式会社フランシールは、プライバシーマークを取得し個人情報保護に努めております。

最近のコメント