You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
В регулярке ATOM каждый символ пунктуации рассматривается как отдельный атом, то есть слияние ожидается от процедуры сегментации
В процедуре punct судя по всему только содержимое двух атомов приходит, :-, -). Видимо, раньше здесь какое-то другое правило склеивало :- в один буффер, а punct проверяло завершающую скобочку ).
def punct(split):
if split.left_1.type != PUNCT or split.right_1.type != PUNCT:
return
left = split.left
right = split.right
+ if split.right_2 and SMILE.match(split.buffer + right + split.right_2.text):+ return JOIN
if SMILE.match(split.buffer + right):
return JOIN
if left in ENDINGS and right in ENDINGS:
# ... ?!
return JOIN
if left + right in ('--', '**'):
# ***
return JOIN
The text was updated successfully, but these errors were encountered:
Тест-кейс:
ATOM
каждый символ пунктуации рассматривается как отдельный атом, то есть слияние ожидается от процедуры сегментацииpunct
судя по всему только содержимое двух атомов приходит,:-
,-)
. Видимо, раньше здесь какое-то другое правило склеивало:-
в один буффер, аpunct
проверяло завершающую скобочку)
.Предлагаемый патч, проверяем третий токен
The text was updated successfully, but these errors were encountered: