#! /bin/perl -f
# Splits words/syllabes of "ECC" text according to 
# 1-1 patterns observed in newline breaks.
# Inserts "+" for strong break, ":" for possible break,
# "-" for non-break.
# Usage: 
# cat file.ecc \
#   | sed -e 's/\(.\)/\1 /g' -e 's/ $//g' \
#   | split-ecc-by-nl-patterns \
#   | split-ecc-by-nl-patterns \
#   | tr -d ' \-' | tr '+:' ' \-' \
#   > file-split.fsg
# NOTE: must be run *twice* to catch all patterns.
#
s/\([qHPw]\) \(.\)/\1-\2/g
s/\(.\) \([mwk]\)/\1-\2/g
s/\([c]\) \([co8eHPr]\)/\1-\2/g
s/\([8]\) \([co]\)/\1-\2/g
s/\([m]\) \([c]\)/\1-\2/g
#
s/\([8rk]\) \([8]\)/\1\+\2/g
s/\([8erkm]\) \([eHPqr]\)/\1\+\2/g
s/\([o]\) \([8P]\)/\1\+\2/g
s/\([k]\) \([co]\)/\1\+\2/g
#
s/\([HPerm8c].o\) \(o.[crm8]\)/\1\+\2/g
s/\([HPemr].o\) \(c.c\|q.o\|q.c\)/\1\+\2/g
s/\([emr].o\) \(o.[HPeqokw]\)/\1\+\2/g
s/\([Pem8o].o\) \(r.[oq]\)/\1\+\2/g
s/\(8.o\) \(H.[oc]\)/\1\+\2/g
s/\(H.o\) \(H.c\)/\1\+\2/g
s/\(o.e\|o.m\|o.r\|c.e\) \(o.c\)/\1\+\2/g
s/\(o.e\) \(8.c\)/\1\+\2/g
s/\(H.c\) \(q.o\)/\1\+\2/g
#
s/\([HP8c].o\) \(o.[HPeqokw]\)/\1:\2/g
s/\([8c].o\) \(c.c\|q.o\|q.c\|e.c\|r.c\)/\1:\2/g
s/\(H.o\) \(r.o\)/\1:\2/g
s/\(e.o\) \(H.o\)/\1:\2/g
s/\(r.o\) \(r.o\|H.c\|e.o\)/\1:\2/g
s/\(c.o\) \(r.[oq]\|H.[oc]\)/\1:\2/g
s/\(o.m\|o.r\|c.e\) \(c.c\|8.o\|8.c\)/\1:\2/g
s/\(o.e\) \(8.o\)/\1:\2/g
s/\(o.[em]\) \(o.H\)/\1:\2/g
s/\(o.e\|o.r\|c.e\) \(o.e\)/\1:\2/g
