[フレーム]
はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできます コメント表示の設定

ブックマークしました

ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

265users がブックマーク コメント 44

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

アイヌ語仮名「ㇷ゚」に対する正規表現の罠

265 users zenn.dev/mkpoli

ガイドラインをご確認の上、良識あるコメントにご協力ください

0 / 0
入力したタグを追加

現在プライベートモードです 設定を変更する

おすすめタグタグについて

よく使うタグ

はてなブックマーク

はてなブックマークで
関心をシェアしよう

みんなの興味と感想が集まることで
新しい発見や、深堀りがもっと楽しく

ユーザー登録

アカウントをお持ちの方はログインページ

記事へのコメント44

  • 注目コメント
  • 新着コメント
obakeshooter
ごく最近実写版キャストが決まった事でゴールデンカムイが話題に上がり、「ウコチャヌㇷ゚コㇿ...」を思い出して検索したらㇷ゚の存在に気づいたところだったから、マジでびっくりした ウコチャヌㇷ゚コㇿ...

その他
atsushieno
C#/.NETは環境次第なところがあるので明記したほうがいいと思う(Windows .NET Core / non-Windows .NET Core / Monoで実装が違う、というかmonoでは自分がそんな新しい文字まで実装していない)

その他
pakila
アイヌ語と韓国・朝鮮語には系統関係が証明されてないよ。日本語含めて、3つとも孤立した言語(あるいは独立した語族)

その他
Lumin
正直アイヌ語表記はひらがなよりハングルのがよほどしっくりくる

その他
came8244
そうなんだ。まさに韓国語と同じ発音体系だな。ツングース語族だっけ

その他
victoriaxxx
夏休みにウポポイでアイヌ語発音を学んで「日本文字よりアルファベットのほうが向いてるな」と思ってたけどシステム上もややこしいのね/id:blueboy 表記整備した当時のアイヌ人が日本語話者だったから仕方ないのでは

その他
yarumato
"この半濁点はU+309Aという結合文字。正規表現エンジンには、カタカナと見なす実装とそうでない実装がある。Perl/Ruby/Python/JavaScript/C#/Java/Golang/Rust などバラバラ"

その他
BigHopeClasic
金田一京助と知里真志保のアイヌ語カナ表記に関する発明についてはこちらが詳しい http://www.aa.tufs.ac.jp/~asako/unwritten/01-nakagawa.pdf / id:blueboy みたいなのは特にこれを読む必要がある(言うまでもなく知里はアイヌ人)

その他
hituzinosanpo
ブコメ、閉音節の言語なんて いくらでも ありますやんか。「韓国語と同じ発音体系」って なに。

その他
fog-og-frog2
アイヌ語になった瞬間ザワつくの、アイヌ語を片仮名で頑張った先人の置き土産...Pokémonとか結合文字は欧州だと一般的なのにな。

その他
narwhal
欧語は日本語と異なり閉音節も存在するので、表記の際音素文字であるラテン文字なら何も問題が生じない。しかし、元々開音節言語である日本語に特化したカタカナのような仮名文字で表記する際 (以下略

その他
ya--mada
グヌヌヌ

その他
vanillaalice
ナコルルは技名を正しいアイヌ語の発音で叫ぶけど紫ナコルルは字面通りに読んでいるそうですね(関係ない)

その他
poponponpon
チタタプ

その他
rryu
U+309AのScriptプロパティは「inherited」で、直前の基本文字のScriptプロパティを継承するのでそれをちゃんと実装しているかによるのだと思う。

その他
blueboy
アルファベットを使えば済むのに。何で仮名を使う? アイヌを日本語の一部だとでも思っているのか?

その他
dollarss
私の技術者人生で『正規表現完全に理解した』人をみかけない。チョトワカルなら結構見るが...euc時代が一番触ったな、片鱗を見ただけで背筋が凍ったもんだ...ハハハ

その他
kyasarin123
アシㇼパさんもいつも変換する時に一瞬、悩みながら変換す?アレか?(ワタシ脳内で発音しながら文字を読む派なので)

その他
memoyashi
画面表示やDBインサートのテスト用にメモしておこう→ウコチャヌㇷ゚コㇿ

その他
field_combat
へー

その他
fog-og-frog2
fog-og-frog2 アイヌ語になった瞬間ザワつくの、アイヌ語を片仮名で頑張った先人の置き土産...Pokémonとか結合文字は欧州だと一般的なのにな。

2023年09月01日 リンク

その他
mas-higa
結合文字は 1文字という理解で正しければ、正規表現で 1文字を正しく扱えていないという話かな? 昔マルチバイト文字に対応してないプログラムが Shift JIS や EUC の文字の途中で分割して文字化けしたりしてたのと似てる

その他
akiramaz
この表記方法、そういう意味だったんだ。諸外国語の閉音節もどんどんこれで表現してみたい。(ヴィエッ・ナㇺ在住)

その他
nakayossi
アイヌ語をハングル表記する動画あったような / これ https://m.youtube.com/watch?v=D-Hrf1lY1Fg

その他
roirrawedoc
こうやって真面目に取り組んでる人がいるからそのうち何も考えなくても使えるようになるんだね

その他
lyiase
Unicode のブロック指定( \p{InKatakana} と \p{InKatakana_Phonetic_Extensions} )すればいいやん...って思ったんだけど何か問題があるのだろうか。

その他
mohno
(ぅゎぁ......文字コード関わりたくねぇ......)

その他
hituzinosanpo
hituzinosanpo ブコメ、閉音節の言語なんて いくらでも ありますやんか。「韓国語と同じ発音体系」って なに。

2023年09月01日 リンク

その他
gfx
おお...。こういうのに関心がもたれるの、完全に『ゴールデンカムイ』のおかげだよなあ。

その他
BigHopeClasic
BigHopeClasic 金田一京助と知里真志保のアイヌ語カナ表記に関する発明についてはこちらが詳しい http://www.aa.tufs.ac.jp/~asako/unwritten/01-nakagawa.pdf / id:blueboy みたいなのは特にこれを読む必要がある(言うまでもなく知里はアイヌ人)

2023年09月01日 リンク

その他
kkobayashi
英語のカタカナ表記みたいにしたらダメなのかな

その他
kusigahama
ウコチャヌㇷ゚コㇿ問題

その他
Windymelt
面白い!そして文字コードは人類には早い

その他
wataken44
どっかでつかうかもしれないので

その他
victoriaxxx
victoriaxxx 夏休みにウポポイでアイヌ語発音を学んで「日本文字よりアルファベットのほうが向いてるな」と思ってたけどシステム上もややこしいのね/id:blueboy 表記整備した当時のアイヌ人が日本語話者だったから仕方ないのでは

2023年09月01日 リンク

その他
pakila
pakila アイヌ語と韓国・朝鮮語には系統関係が証明されてないよ。日本語含めて、3つとも孤立した言語(あるいは独立した語族)

2023年09月01日 リンク

その他
Lumin
Lumin 正直アイヌ語表記はひらがなよりハングルのがよほどしっくりくる

2023年09月01日 リンク

その他
sekiryo
ウコチャヌㇷ゚コㇿは外国語としてイメージ が脱臭されて連呼されてるけど「交尾!」連呼してるのと変わらんのだよな。

その他
quality1
インターネット老人会が好きそうなヵッォを思い出した

その他
teecup
カタカナとは何かという定義が曖昧なんだろうな。

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

リンクを埋め込む

以下のコードをコピーしてサイトに埋め込むことができます

プレビュー
アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

usersに達しました!

さんが1番目にブックマークした記事「アイヌ語仮名「ㇷ゚...」が注目されています。

気持ちをシェアしよう

ツイートする

アイヌ語仮名「ㇷ゚」に対する正規表現の罠

導入 アイヌ語は日語と異なり、閉音節(子音で終わる音節)も存在するので、表記の際音素文字であるラ... 導入 アイヌ語は日語と異なり、閉音節(子音で終わる音節)も存在するので、表記の際音素文字であるラテン文字なら、そのまま p, t, k, m, n, s, r などの子音文字を後ろの付ければ良いわけなので、アイヌ語ローマ字表記では、何も問題が生じない。しかし、元々開音節言語である日語に特化したカタカナのような仮名文字で表記する際、鼻音 n は「ン」でなんとかなる(実はそれでもまずい事になっているけどここでは割愛する)が、p, t, k, m, n, s, r, h はどうしようもないので、特殊の捨て仮名(小書き仮名文字)を利用することになっている。 具体的には以下のような特殊仮名文字(通称 アイヌ語仮名)である。 ㇷ゚ -p ッ -t ㇰ -k ㇺ -m ㇱ -s ㇻ -(a)r, ㇼ -(i)r, ㇽ -(u)r, ㇾ -(e)r, ㇿ -(o)r お分かり頂けただろうか... 問題 r

ブックマークしたユーザー

  • techtech05212024年06月14日 techtech0521
  • ZAORIKU2024年03月17日 ZAORIKU
  • t_thor2023年09月13日 t_thor
  • rikuo2023年09月07日 rikuo
  • tatatayou2023年09月02日 tatatayou
  • kfly82023年09月02日 kfly8
  • advblog2023年09月02日 advblog
  • m0t0m0t02023年09月02日 m0t0m0t0
  • yauaa2023年09月02日 yauaa
  • somathor2023年09月02日 somathor
  • narwhal2023年09月01日 narwhal
  • gyampy2023年09月01日 gyampy
  • delegate2023年09月01日 delegate
  • sakito09022023年09月01日 sakito0902
  • funaki_naoto2023年09月01日 funaki_naoto
  • hush_in2023年09月01日 hush_in
  • hnagoya2023年09月01日 hnagoya
  • ya--mada2023年09月01日 ya--mada
すべてのユーザーの
詳細を表示します

ブックマークしたすべてのユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む

はてなブックマーク

公式Twitter

はてなのサービス

Copyright © 2005-2025 Hatena. All Rights Reserved.
設定を変更しましたx

AltStyle によって変換されたページ (->オリジナル) /