システムと異なる文字コードなファイルに対する grep

ってことで、記念すべき第 1 回目の技術ネタ!


私は Mac から Terminal.app 使って Xen の上に居る開発マシンで vim 使ってモリモリ開発してます。

普段は文字化けとか気にせずに開発出来るように設定してるので文字コードについてはそこまで意識してません。

しかし、大量のファイルのマルチバイトな文字列を一括で置換する必要が出てきたので、対象ファイルを抽出したいなぁとか思ったわけですわ。

具体的に言うと、UTF-8 なシステム上にある EUC-JP なファイルの部分文字列引っ掛けてリストアップしたい状況なわけですよ。

まぁ、真っ先に思いつくのが「grep すりゃええやん」ってことなんですが、「マルチバイトの grep って…?」ってことで色々試行錯誤したですよ。

結果として、かなりシンプルに出来ることが判明したので、覚書。

続きを読む

所信表明演説

もしもがはてなを使ってみる。

皆さん初めまして。

株式会社もしも のソリューションチームの monry と申します。

# はてな的には id:moshimonry が正しいんですかね?


弊社は日本最大手のドロップシッピング ASP である "もしもドロップシッピング" を運営する会社でございます。

株式会社はてな 様と名前を頻繁に間違えられる会社でございます。はてなの皆様ごめんなさい。

そんな知名度の低い我々は、如何にして我々のことを世の中に認知して頂くかを考えました。

3 日 3 晩 3 分くらい考えました。喫煙所で。

その結果、「ブログでも書けば良いじゃん!」と安易極まりない発想が生まれました。


ってことで、今この瞬間に id:moshimonry (ブログなんて殆ど書いたこと無い) がシコシコと執筆活動に勤しんでるわけです。

自信を持って「更新頻度は著しく劣悪だろう」と思えるわけですが、お付き合い頂ければ幸いです。

主に、開発秘話とか浅い技術ネタとか 愚痴とか を書き殴っていく予定です。

ってか、アンタ誰?

株式会社もしも のソリューションチー… (ry


僭越ながら株式会社もしものエンジニアとして、毎日プログラム書いたりプログラム書いたりプログラム書いたりしてます。

たまにドキュメント書いたりプレゼン資料作ったりもしてます。


弊社のシステムは完全自社開発なわけで、社内で生まれたアイデアってのは全てソリューションチームがコンピュータの力を借りて具現化しなければなりません。

当然、そのコンピュータのお世話もしなきゃいけないし、社内のネットワーク管理もしなきゃいけないし、データ抽出やらログの解析やらもしなきゃいけないわけです。

しかも、それらが長期的な納期を貰えるなんてことは無いわけです。

社長が「これ、出来ませんかねぇ…?」とか企画の人間が「これ、面白そうっすね!」とか持ってきて、それが 2 週間後にリリースとかがデフォルトなわけです。

んで、そんな膨大なタスクを「メンバーの誰かに振る」とか「これはオレがやるか…orz」とか「いや、マジ無理っす!!」みたいな調整・交渉をするような立場だったりもします。

ま、当然のようにメンバーからは「んな無茶な納期を受けるな!」とか「いやいやいやいや、マジ無理」などと怒られる立場だったりもしますが。


ちなみに、id:moshimonry は以下のようなスペックです。

  • OS: ♂
  • 生産年: 昭和 59 年度製
  • 生産地域: 彩の国
  • 形状: 中肉中背 + α
  • 特技: 会社で寝られること
  • 好物: Mac (Apple 的な意味で)、妻
  • 言語: ja_JP, PHP, Java, HTML, CSS, JavaScript

多分、Intel は入ってません。


まぁ、そんなヘタレなエンジニアが "日々の思ったこと" とか、"リリースした機能のアピールポイント" とか、"ちょっとした技術ネタ" とかをダラダラと書いていきますので、適度に期待していて下さい。