У меня есть preg_match_all('/[aäeëioöuáéíóú]/u', $in, $out, PREG_OFFSET_CAPTURE);
UTF-8 символов в preg_match_all (PHP)
Если $in = 'hëllo'
$out
является:
array(1) {
[0]=>
array(2) {
[0]=>
array(2) {
[0]=>
string(2) "ë"
[1]=>
int(1)
}
[1]=>
array(2) {
[0]=>
string(1) "o"
[1]=>
int(5)
}
}
}
Положение o
должно быть 4. Я прочитал об этой проблеме в оперативном режиме (ë
подсчитывается как 2). Есть ли решение для этого? Я видел mb_substr
и тому подобное, но есть ли что-то вроде этого для preg_match_all
?
Вид связанных: Является ли их эквивалент preg_match_all
в Python? (Возвращение массива совпадений с их положением в строке)
вы должны спросить, что в другом вопросе, но да ... питон регулярное выражение matchobject содержит позицию совпадения по умолчанию mo.start() и mo.end() –