#! /bin/perl -f
# Splits words/syllabes according to 
# 1-1 patterns observed in newline breaks.
# Inserts "+" for strong break, ":" for possible break,
# "-" for non-break.
# Usage: 
# cat file.fsg \
#   | sed -e 's/\(.\)/\1 /g' \
#   | split-by-nl-patterns \
#   | split-by-nl-patterns \
#   | tr -d ' \-' | tr '+:' ' -' \
#   > file-split.fsg
# NOTE: must be run *twice* to catch all patterns.
#
s/\(.\) \([A6KLMNIZ]\)/\1-\2/g
s/\([AI4PFDHCSTZ]\) \(.\)/\1-\2/g
s/\([2MNRE]\) \([G]\)/\1-\2/g
s/\([L8O]\) \([CPFEDHSTR4G8O]\)/\1-\2/g
#
s/\([26KMNREG]\) \([PF]\)/\1\+\2/g
s/\([2L68OKMNREG]\) \([2]\)/\1\+\2/g
s/\([G]\) \([CPFG]\)/\1\+\2/g
s/\([MNR]\) \([EDHG]\)/\1\+\2/g
s/\([MER2]\) \([4]\)/\1\+\2/g
s/\([R]\) \([8R]\)/\1\+\2/g
#
s/\([2]\) \([EDHSTRG8O]\)/\1:\2/g
s/\([MNR]\) \([ST]\)/\1:\2/g
s/\([E]\) \([EDHSTG8]\)/\1:\2/g
s/\([G]\) \([EDHSTR8]\)/\1:\2/g
s/\([MN]\) \([8]\)/\1:\2/g
s/\([MNREG]\) \([O]\)/\1:\2/g