ai-content-maker/.venv/Lib/site-packages/spacy/lang/pt/tokenizer_exceptions.py

from ...symbols import ORTH
from ...util import update_exc
from ..tokenizer_exceptions import BASE_EXCEPTIONS

_exc = {}


for orth in [
    "Adm.",
    "Art.",
    "art.",
    "Av.",
    "av.",
    "Cia.",
    "dom.",
    "Dr.",
    "dr.",
    "e.g.",
    "E.g.",
    "E.G.",
    "e/ou",
    "ed.",
    "eng.",
    "etc.",
    "Fund.",
    "Gen.",
    "Gov.",
    "i.e.",
    "I.e.",
    "I.E.",
    "Inc.",
    "Jr.",
    "km/h",
    "Ltd.",
    "Mr.",
    "p.m.",
    "Ph.D.",
    "Rep.",
    "Rev.",
    "S/A",
    "Sen.",
    "Sr.",
    "sr.",
    "Sra.",
    "sra.",
    "vs.",
    "tel.",
    "pág.",
    "pag.",
]:
    _exc[orth] = [{ORTH: orth}]


TOKENIZER_EXCEPTIONS = update_exc(BASE_EXCEPTIONS, _exc)
first commit 2024-05-03 04:18:51 +03:00			`from ...symbols import ORTH`
			`from ...util import update_exc`
			`from ..tokenizer_exceptions import BASE_EXCEPTIONS`

			`_exc = {}`


			`for orth in [`
			`"Adm.",`
			`"Art.",`
			`"art.",`
			`"Av.",`
			`"av.",`
			`"Cia.",`
			`"dom.",`
			`"Dr.",`
			`"dr.",`
			`"e.g.",`
			`"E.g.",`
			`"E.G.",`
			`"e/ou",`
			`"ed.",`
			`"eng.",`
			`"etc.",`
			`"Fund.",`
			`"Gen.",`
			`"Gov.",`
			`"i.e.",`
			`"I.e.",`
			`"I.E.",`
			`"Inc.",`
			`"Jr.",`
			`"km/h",`
			`"Ltd.",`
			`"Mr.",`
			`"p.m.",`
			`"Ph.D.",`
			`"Rep.",`
			`"Rev.",`
			`"S/A",`
			`"Sen.",`
			`"Sr.",`
			`"sr.",`
			`"Sra.",`
			`"sra.",`
			`"vs.",`
			`"tel.",`
			`"pág.",`
			`"pag.",`
			`]:`
			`_exc[orth] = [{ORTH: orth}]`


			`TOKENIZER_EXCEPTIONS = update_exc(BASE_EXCEPTIONS, _exc)`