名前 | 別名 | 説明 |
---|---|---|
C | Other | その他の文字 |
Cc | Control | コントロール文字 |
Cf | Format | 非可視整形文字 |
Cn | Unassigned | 未定義コードポイント |
Co | Other_Use | 私的利用領域サロゲート |
Cs | Surrogate | サロゲート |
L | Letter | 全ての文字 |
Ll | Lowercase_Letter | 小文字 |
Lm | Modifier_Letter | 修飾子 |
Lo | Other_Letter | その他の文字 |
Lt | Titlecase_Letter | タイトル文字 |
Lu | Uppercase_Letter | 大文字 |
L& | 大文字、小文字、タイトル文字 | |
M | Mark | 全てのマーク |
Mc | Spacing_Combining_Mark | スペース結合 |
Me | Enclosing_Mark | 囲む |
Mn | Non_Spacing_Mark | スペースなし |
N | Number | 全ての数字 |
Nd | Decimal_Digit_Number | 10進数字 |
Nl | Letter_Number | 数値を表す文字 |
No | Other_Number | その他の数字 |
P | Punctuation | 全ての句読点 |
Pc | Connector_Punctuation | 連結用句読点 |
Pd | Dash_Punctuation | ダッシュ |
Pe | Close_Punctuation | 閉じ句読点 |
Pf | Final_Punctuation | 末尾句読点 |
Pi | Initial_Punctuation | 先頭句読点 |
Po | Other_Punctuation | その他の句読点 |
Ps | Open_Punctuation | 開き句読点 |
S | Symbol | 全ての記号 |
Sc | Currency_Symbol | 通貨記号 |
Sk | Mofifier_Symbol | 合わせ文字 |
Sm | Math_Symbol | 数字記号 |
So | Other_Symbol | その他の記号 |
Z | Separator | 全ての区切り文字 |
Zl | Line_Separator | 行区切り文字 |
Zp | Paragraph_Separator | 段落区切り文字 |
Zs | Space_Separator | 空白文字 |
名前 | 説明 |
---|---|
Alnum | [\p{L}\p{M}\p{Nd}]と同じ。 |
Alpha | [\p{L}\p{M}]と同じ。 |
Ascii | [\x00-\x7F]と同じ。 |
Blank | [\x09\p{Zs}]と同じ。 |
Cntrl | \p{C}と同じ。 |
Digit | \p{Nd}と同じ。 |
Graph | [\P{Space}\P{Cc}\P{Cn}\P{Cs}]と同じ。 |
Lower | \p{Ll}と同じ。 |
[{\p{Graph}\p{Space}]と同じ。 | |
Upper | \p{Lu}と同じ。 |
Punct | \p{P}と同じ。 |
Space | [\t\n\v\f\r\x85\p{Z}]と同じ。 |
XDigit | [A-Fa-f0-9]と同じ。 |
Word | [\p{L}\p{M}\p{Nd}\p{Pc}]と同じ。 |
Any | [\u0000-\uFFFF]と同じ。 |
Assigned | \P{Cn}と同じ。 |
Unicode の Script 名を指定できます。
文字の区切りとしてアンダースコア(_)、ハイフン(-)、スペースがあっても認識します。
Common, Latin, Greek, Cyrillic, Armenian, Hebrew, Arabic, Syriac, Thaana, Devanagari, Bengali, Gurmukhi, Gujarati, Oriya, Tamil, Telugu, Kannada, Malayalam, Sinhala, Thai, Lao, Tibetan, Myanmar, Georgian, Hangul, Ethiopic, Cherokee, Canadian_Aboriginal, Ogham, Runic, Khmer, Mongolian, Hiragana, Katakana, Bopomofo, Han, Yi, Old_Italic, Gothic, Deseret, Inherited, Tagalog, Hanunoo, Buhid, Tagbanwa, Limbu, Tai_Le, Linear_B, Ugaritic, Shavian, Osmanya, Cypriot, Braille, Buginese, Coptic, New_Tai_Lue, Glagolitic, Tifinagh, Syloti_Nagri, Old_Persian, Kharoshthi, Balinese, Cuneiform, Phoenician, Phags_Pa, Nko
Unicode の Block 名を指定できます。標準の Block 名の先頭に In を付けて指定してください。.NET と同様、In の代わりに Is を付けても認識できます。
文字の区切りとして、アンダーバー( _ )、ハイフン( - )、スペースがあっても認識します。
InBasicLatin, InLatin1Supplement, InLatinExtendedA, InLatinExtendedB, InIPAExtensions, InSpacingModifierLetters, InCombiningDiacriticalMarks, InGreekandCoptic, InCyrillic, InCyrillicSupplement, InArmenian, InHebrew, InArabic, InSyriac, InArabicSupplement, InThaana, InNKo, InDevanagari, InBengali, InGurmukhi, InGujarati, InOriya, InTamil, InTelugu, InKannada, InMalayalam, InSinhala, InThai, InLao, InTibetan, InMyanmar, InGeorgian, InHangulJamo, InEthiopic, InEthiopicSupplement, InCherokee, InUnifiedCanadianAboriginalSyllabics, InOgham, InRunic, InTagalog, InHanunoo, InBuhid, InTagbanwa, InKhmer, InMongolian, InLimbu, InTaiLe, InNewTaiLue, InKhmerSymbols, InBuginese, InBalinese, InPhoneticExtensions, InPhoneticExtensionsSupplement, InCombiningDiacriticalMarksSupplement, InLatinExtendedAdditional, InGreekExtended, InGeneralPunctuation, InSuperscriptsandSubscripts, InCurrencySymbols, InCombiningDiacriticalMarksforSymbols, InLetterlikeSymbols, InNumberForms, InArrows, InMathematicalOperators, InMiscellaneousTechnical, InControlPictures, InOpticalCharacterRecognition, InEnclosedAlphanumerics, InBoxDrawing, InBlockElements, InGeometricShapes, InMiscellaneousSymbols, InDingbats, InMiscellaneousMathematicalSymbolsA, InSupplementalArrowsA, InBraillePatterns, InSupplementalArrowsB, InMiscellaneousMathematicalSymbolsB, InSupplementalMathematicalOperators, InMiscellaneousSymbolsandArrows, InGlagolitic, InLatinExtendedC, InCoptic, InGeorgianSupplement, InTifinagh, InEthiopicExtended, InSupplementalPunctuation, InCJKRadicalsSupplement, InKangxiRadicals, InIdeographicDescriptionCharacters, InCJKSymbolsandPunctuation, InHiragana, InKatakana, InBopomofo, InHangulCompatibilityJamo, InKanbun, InBopomofoExtended, InCJKStrokes, InKatakanaPhoneticExtensions, InEnclosedCJKLettersandMonths, InCJKCompatibility, InCJKUnifiedIdeographsExtensionA, InYijingHexagramSymbols, InCJKUnifiedIdeographs, InYiSyllables, InYiRadicals, InModifierToneLetters, InLatinExtendedD, InSylotiNagri, InPhagspa, InHangulSyllables, InHighSurrogates, InHighPrivateUseSurrogates, InLowSurrogates, InPrivateUseArea, InCJKCompatibilityIdeographs, InAlphabeticPresentationForms, InArabicPresentationFormsA, InVariationSelectors, InVerticalForms, InCombiningHalfMarks, InCJKCompatibilityForms, InSmallFormVariants, InArabicPresentationFormsB, InHalfwidthandFullwidthForms, InSpecials, InLinearBSyllabary, InLinearBIdeograms, InAegeanNumbers, InAncientGreekNumbers, InOldItalic, InGothic, InUgaritic, InOldPersian, InDeseret, InShavian, InOsmanya, InCypriotSyllabary, InPhoenician, InKharoshthi, InCuneiform, InCuneiformNumbersandPunctuation, InByzantineMusicalSymbols, InMusicalSymbols, InAncientGreekMusicalNotation, InTaiXuanJingSymbols, InCountingRodNumerals, InMathematicalAlphanumericSymbols, InCJKUnifiedIdeographsExtensionB, InCJKCompatibilityIdeographsSupplement, InTags