この度、日本のお客様の要望を受け、ストレージコンポーネント(SFTP, S3, Google Cloud Storage,Azure Blob Storage)で日本語ファイルのサポート機能を強化しました。
- エンコーディングオプションとしてWindows-31Jを追加
- ファイル保存時の改行コードに「CRLF」を追加
- エスケープキャラクターの指定が可能
このブログでは、今回追加された上記の機能について紹介します。
Table of Contents:
エンコーディングオプション:Windows-31J
改行コードの指定
エスケープキャラクターの指定
最後に
エンコーディングオプション:Windows-31J
Integrate.ioではすでに2020年1月にShift-JISでエンコーディングされたCSV,TSVファイルに対応していましたが、今回の対応により、Shift_JISを拡張した文字コードである「Windows-31J」が追加されました。これにより、Shift-JISでは文字化けするような拡張文字である「①」、「㈱」などの文字を含むテキストファイルについても対応できるようになりました。
ストレージのSource コンポーネントおよびDestinationコンポーネントで、以下のように設定可能です。
Source コンポーネント
Source actionで「Copy, merge and process all files」もしくは「Process only new files (Incremental load)」を選択し、Character encodingのリストボックスで「Windows-31J 」を選択します。
Destination コンポーネント
Destination actionで「Use intermediate storage and copy files to an existing directory in destination」を選択し、Character encodingのリストボックスで「Windows-31J」を選択します。
改行コードの指定
Destination コンポーネント
Destinationコンポーネントでファイル保存時の改行コードの指定が可能になりました。これにより、LFに加えて、CRLFでの保存が可能になりました。
エスケープキャラクターの指定
Source/Destinationコンポーネント
最後に
Integrate.ioでは今後も日本のお客様の要望にお応えし、必要な機能を随時追加していく予定です。もし、今回追加された機能を使って、実際にデータパイプラインを作成してみたいという方は、ぜひオンラインデモにお申し込みいただき、トライアルで実際に触ってみてください。