Skip to main content

Japanese text functions for Python 3

Project description

Utility functions to manipulate Japanese texts.

Requirements

  • Python 3.3 or later

Functions

guess(s)

文字列 s のエンコーディングを推測する。戻り値は UNKNOWN, ASCII, SJIS, EUC, JIS, UTF8, UTF16_LE, UTF16_BE のいずれかとなる。 UTF16_LE と UTF16_BE は、文字列の先頭にBOMが付与されている場合のみ検出される。

sjistojis(s), sjistoeuc(s), euctosjis(s), euctojis(s), jistosjis(s), jistoeuc(s)

文字列 s を、異なるエンコーディングに変更する。

kanatohalf(ustr), kanatofull(ustr)

Unicode文字列 ustr に含まれるカタカナ・句読点等を、半角<->全角に変換する。

tohalf(ustr), tofull(ustr)

Unicode文字列 ustr に含まれるカタカナ・句読点等以外の、cp932に含まれる文字を、半角<->全角に変換する。

getnengo(y, m, d, letter=False)

y年m月d日の年号と年のタプルを返す。letter=Trueの場合は年号としてH/S/T/Mのいずれかを返す。

heiseitoyear(y), showatoyear(y), taishoyear(y), meijitoyear(y)

平成、昭和、大正、明治の年から、西暦を返す。

wrap(ustr, maxcol)

Unicode文字列 ustr を、maxcol桁の文字列に分割する。ワードラップ・行頭禁則対応。

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

pyjf3-0.3.tar.gz (14.1 kB view hashes)

Uploaded Source

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page