最近跑了一个话题(作者后来因为某种原因删掉了),请求帮助在Python中实现俄语单词的断字。他们的条件是:
a ) 如果第一个元音前面有一个辅音,第二个后面至少有一个字母,则可以分隔两个连续的元音(字母 i 与前面的元音视为一个整体);
b ) 连续的两个辅音如果第一个辅音前面有一个元音,则可以分开,并且在第二个辅音后面的单词部分中,至少有一个元音(字母b,b被认为是a全与前面的辅音);
c ) 如果 (a) 和 (b) 段中规定的规则不能适用,那么你应该尝试断词,使第一部分包含多个字母并以元音结尾,第二部分至少包含一个元音。
我不确定我是否已经完全实现了所有条件的满足,所以如果有优化建议,我很乐意接受。
如果脚本的工作适合,如果有人需要,请使用它来保护您的健康。代码在答案中。
例子: