2013-02-13 2 views
4

Интересно, можно ли написать регулярное выражение для индийских символов? Я хочу проверить, является ли данный символ индийской буквой или номером. Я нашел эти два вопроса:Регулярные выражения с индийскими персонажами

What are the unicode ranges for Hindi accented characters?

what is the range for Hindu–Arabic (ARABIC-INDIC) numeral utf8 from 0 to 9

поэтому я попытался это: \ х {0600} - \ х {06ff}

Но если искать этот текст (в OpenOffice) : http://pastebin.com/mDHL69XH с этим: \ х {0600} - \ х {06ff} ничего не найдено ...

+1

Различные регулярного выражения двигатели отличаются. Вы говорите, что «хотите подтвердить, является ли данный символ индийской буквой или номером», что предполагает, что вы используете какой-то язык программирования, но затем вы говорите, что вы «просматриваете этот текст (в OpenOffice)», что предполагает что вы пытаетесь * проверить * свое регулярное выражение с помощью * нового * регулярного выражения. Это плохая идея. – ruakh

+0

вы должны указать язык, с которым работаете, – Anirudha

+0

Я никогда не углублялся в регулярные выражения ... поэтому для меня все новые новички :) Я действительно пытаюсь сделать это в javascript ... – user568021

ответ

8

Ну это должно сделать

[\u0900-\u097F]+// \uFFFF format supported by Java,.net 

или

[\u{0900}-\u{097F}]+// \u{FFFF} format supported by perl,pcre 

или

\p{Devanagari}//not widely supported 
+0

awesome ... первый работает отлично ... – user568021