RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / 问题 / 900660
Accepted
Ole Lukøje
Ole Lukøje
Asked:2020-11-01 07:18:37 +0000 UTC2020-11-01 07:18:37 +0000 UTC 2020-11-01 07:18:37 +0000 UTC

俄语单词中的断字

  • 772

最近跑了一个话题(作者后来因为某种原因删掉了),请求帮助在Python中实现俄语单词的断字。他们的条件是:

a ) 如果第一个元音前面有一个辅音,第二个后面至少有一个字母,则可以分隔两个连续的元音(字母 i 与前面的元音视为一个整体);
b ) 连续的两个辅音如果第一个辅音前面有一个元音,则可以分开,并且在第二个辅音后面的单词部分中,至少有一个元音(字母b,b被认为是a全与前面的辅音);
c ) 如果 (a) 和 (b) 段中规定的规则不能适用,那么你应该尝试断词,使第一部分包含多个字母并以元音结尾,第二部分至少包含一个元音。

我不确定我是否已经完全实现了所有条件的满足,所以如果有优化建议,我很乐意接受。

如果脚本的工作适合,如果有人需要,请使用它来保护您的健康。代码在答案中。

python
  • 1 1 个回答
  • 10 Views

1 个回答

  • Voted
  1. Best Answer
    Ole Lukøje
    2020-11-01T07:18:57Z2020-11-01T07:18:57Z
    #!/usr/bin/env python3
    # -*- encode: utf-8 -*-
    
    def w_wrap(word: str) -> str:
        def is_vow(let: str) -> bool:
            _vowels = ['а', 'о', 'и', 'е', 'ё', 'э', 'ы', 'у', 'ю', 'я', 'А', 'О', 'И', 'Е', 'Ё', 'Э', 'Ы', 'У', 'Ю', 'Я']
            return let in _vowels
    
        def is_cons(let: str) -> bool:
            _consonants = ['б', 'в', 'г', 'д', 'ж', 'з', 'к', 'л', 'м', 'н', 'п', 'р', 'с', 'т', 'ф', 'х', 'ц', 'ч', 'щ',
                           'ш', 'Б', 'В', 'Г', 'Д', 'Ж', 'З', 'К', 'Л', 'М', 'Н', 'П', 'Р', 'С', 'Т', 'Ф', 'Х', 'Ц', 'Ч',
                           'Ш', 'Щ']
            return let in _consonants
    
        def vow_inds(wrd: str):
            return [i for i in range(len(wrd) - 2) if is_vow(wrd[i])]
    
        vow_indices = vow_inds(word)
        if vow_indices and vow_indices[0] + 2 < len(word):
            for ind in vow_indices:
                sep = '-'
                ind += 1
    
                if (is_cons(word[ind]) or word[ind] in 'йЙ') and not is_vow(word[ind + 1]):
                    ind += 1
                if len(word[:ind]) == 1:  # не даем отделять единичные гласные
                    sep = ''
                if len(word) > 3 and word[ind] in 'ьЬЪъ':
                    if word[-1] in 'ьЬЪъ':
                        sep = ''
                    ind += 1
    
                return word[:ind] + sep + w_wrap(word[ind:])
        return word
    
    
    t_word = input('Введите слово: ')
    
    print('Варианты расстановки переносов слова "{}" - [ {} ]'.format(t_word, w_wrap(t_word)))
    

    例子:

    print(w_wrap('собака'))            # со-ба-ка
    print(w_wrap('обезьяна'))          # обезь-яна
    print(w_wrap('программирование'))  # прог-рам-ми-ро-ва-ние
    
    • 8

相关问题

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    是否可以在 C++ 中继承类 <---> 结构?

    • 2 个回答
  • Marko Smith

    这种神经网络架构适合文本分类吗?

    • 1 个回答
  • Marko Smith

    为什么分配的工作方式不同?

    • 3 个回答
  • Marko Smith

    控制台中的光标坐标

    • 1 个回答
  • Marko Smith

    如何在 C++ 中删除类的实例?

    • 4 个回答
  • Marko Smith

    点是否属于线段的问题

    • 2 个回答
  • Marko Smith

    json结构错误

    • 1 个回答
  • Marko Smith

    ServiceWorker 中的“获取”事件

    • 1 个回答
  • Marko Smith

    c ++控制台应用程序exe文件[重复]

    • 1 个回答
  • Marko Smith

    按多列从sql表中选择

    • 1 个回答
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Suvitruf - Andrei Apanasik 什么是空? 2020-08-21 01:48:09 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5