名前付き文字クラスの一覧

Unicode General Category

名前 別名 説明
C Other その他の文字
Cc Control コントロール文字
Cf Format 非可視整形文字
Cn Unassigned 未定義コードポイント
Co Other_Use 私的利用領域サロゲート
Cs Surrogate サロゲート
L Letter 全ての文字
Ll Lowercase_Letter 小文字
Lm Modifier_Letter 修飾子
Lo Other_Letter その他の文字
Lt Titlecase_Letter タイトル文字
Lu Uppercase_Letter 大文字
L&   大文字、小文字、タイトル文字
M Mark 全てのマーク
Mc Spacing_Combining_Mark スペース結合
Me Enclosing_Mark 囲む
Mn Non_Spacing_Mark スペースなし
N Number 全ての数字
Nd Decimal_Digit_Number 10進数字
Nl Letter_Number 数値を表す文字
No Other_Number その他の数字
P Punctuation 全ての句読点
Pc Connector_Punctuation 連結用句読点
Pd Dash_Punctuation ダッシュ
Pe Close_Punctuation 閉じ句読点
Pf Final_Punctuation 末尾句読点
Pi Initial_Punctuation 先頭句読点
Po Other_Punctuation その他の句読点
Ps Open_Punctuation 開き句読点
S Symbol 全ての記号
Sc Currency_Symbol 通貨記号
Sk Mofifier_Symbol 合わせ文字
Sm Math_Symbol 数字記号
So Other_Symbol その他の記号
Z Separator 全ての区切り文字
Zl Line_Separator 行区切り文字
Zp Paragraph_Separator 段落区切り文字
Zs Space_Separator 空白文字

Posix

名前 説明
Alnum [\p{L}\p{M}\p{Nd}]と同じ。
Alpha [\p{L}\p{M}]と同じ。
Ascii [\x00-\x7F]と同じ。
Blank [\x09\p{Zs}]と同じ。
Cntrl \p{C}と同じ。
Digit \p{Nd}と同じ。
Graph [\P{Space}\P{Cc}\P{Cn}\P{Cs}]と同じ。
Lower \p{Ll}と同じ。
Print [{\p{Graph}\p{Space}]と同じ。
Upper \p{Lu}と同じ。
Punct \p{P}と同じ。
Space [\t\n\v\f\r\x85\p{Z}]と同じ。
XDigit [A-Fa-f0-9]と同じ。
Word [\p{L}\p{M}\p{Nd}\p{Pc}]と同じ。
Any [\u0000-\uFFFF]と同じ。
Assigned \P{Cn}と同じ。

Script

Unicode の Script 名を指定できます。

文字の区切りとしてアンダースコア(_)、ハイフン(-)、スペースがあっても認識します。

Common, Latin, Greek, Cyrillic, Armenian, Hebrew, Arabic, Syriac, Thaana, Devanagari, Bengali, Gurmukhi, Gujarati, Oriya, Tamil, Telugu, Kannada, Malayalam, Sinhala, Thai, Lao, Tibetan, Myanmar, Georgian, Hangul, Ethiopic, Cherokee, Canadian_Aboriginal, Ogham, Runic, Khmer, Mongolian, Hiragana, Katakana, Bopomofo, Han, Yi, Old_Italic, Gothic, Deseret, Inherited, Tagalog, Hanunoo, Buhid, Tagbanwa, Limbu, Tai_Le, Linear_B, Ugaritic, Shavian, Osmanya, Cypriot, Braille, Buginese, Coptic, New_Tai_Lue, Glagolitic, Tifinagh, Syloti_Nagri, Old_Persian, Kharoshthi, Balinese, Cuneiform, Phoenician, Phags_Pa, Nko

Block

Unicode の Block 名を指定できます。標準の Block 名の先頭に In を付けて指定してください。.NET と同様、In の代わりに Is を付けても認識できます。

文字の区切りとして、アンダーバー( _ )、ハイフン( - )、スペースがあっても認識します。

InBasicLatin, InLatin1Supplement, InLatinExtendedA, InLatinExtendedB, InIPAExtensions, InSpacingModifierLetters, InCombiningDiacriticalMarks, InGreekandCoptic, InCyrillic, InCyrillicSupplement, InArmenian, InHebrew, InArabic, InSyriac, InArabicSupplement, InThaana, InNKo, InDevanagari, InBengali, InGurmukhi, InGujarati, InOriya, InTamil, InTelugu, InKannada, InMalayalam, InSinhala, InThai, InLao, InTibetan, InMyanmar, InGeorgian, InHangulJamo, InEthiopic, InEthiopicSupplement, InCherokee, InUnifiedCanadianAboriginalSyllabics, InOgham, InRunic, InTagalog, InHanunoo, InBuhid, InTagbanwa, InKhmer, InMongolian, InLimbu, InTaiLe, InNewTaiLue, InKhmerSymbols, InBuginese, InBalinese, InPhoneticExtensions, InPhoneticExtensionsSupplement, InCombiningDiacriticalMarksSupplement, InLatinExtendedAdditional, InGreekExtended, InGeneralPunctuation, InSuperscriptsandSubscripts, InCurrencySymbols, InCombiningDiacriticalMarksforSymbols, InLetterlikeSymbols, InNumberForms, InArrows, InMathematicalOperators, InMiscellaneousTechnical, InControlPictures, InOpticalCharacterRecognition, InEnclosedAlphanumerics, InBoxDrawing, InBlockElements, InGeometricShapes, InMiscellaneousSymbols, InDingbats, InMiscellaneousMathematicalSymbolsA, InSupplementalArrowsA, InBraillePatterns, InSupplementalArrowsB, InMiscellaneousMathematicalSymbolsB, InSupplementalMathematicalOperators, InMiscellaneousSymbolsandArrows, InGlagolitic, InLatinExtendedC, InCoptic, InGeorgianSupplement, InTifinagh, InEthiopicExtended, InSupplementalPunctuation, InCJKRadicalsSupplement, InKangxiRadicals, InIdeographicDescriptionCharacters, InCJKSymbolsandPunctuation, InHiragana, InKatakana, InBopomofo, InHangulCompatibilityJamo, InKanbun, InBopomofoExtended, InCJKStrokes, InKatakanaPhoneticExtensions, InEnclosedCJKLettersandMonths, InCJKCompatibility, InCJKUnifiedIdeographsExtensionA, InYijingHexagramSymbols, InCJKUnifiedIdeographs, InYiSyllables, InYiRadicals, InModifierToneLetters, InLatinExtendedD, InSylotiNagri, InPhagspa, InHangulSyllables, InHighSurrogates, InHighPrivateUseSurrogates, InLowSurrogates, InPrivateUseArea, InCJKCompatibilityIdeographs, InAlphabeticPresentationForms, InArabicPresentationFormsA, InVariationSelectors, InVerticalForms, InCombiningHalfMarks, InCJKCompatibilityForms, InSmallFormVariants, InArabicPresentationFormsB, InHalfwidthandFullwidthForms, InSpecials, InLinearBSyllabary, InLinearBIdeograms, InAegeanNumbers, InAncientGreekNumbers, InOldItalic, InGothic, InUgaritic, InOldPersian, InDeseret, InShavian, InOsmanya, InCypriotSyllabary, InPhoenician, InKharoshthi, InCuneiform, InCuneiformNumbersandPunctuation, InByzantineMusicalSymbols, InMusicalSymbols, InAncientGreekMusicalNotation, InTaiXuanJingSymbols, InCountingRodNumerals, InMathematicalAlphanumericSymbols, InCJKUnifiedIdeographsExtensionB, InCJKCompatibilityIdeographsSupplement, InTags