Eng4Eng~エンジニアのための生きた英語Tips

在米10年目の著者が、実際に遭遇したITエンジニアのためのお役立ち英語Tipsを綴っていきます。

データサイエンティストなら知っておきたい、ビッグデータの「slice and dice」

第2回目のフレーズは「slice and dice」。

複雑なデータを扱うというような文脈で使います。

 

え・・・?上司から「キミ、このビッグデータslice and diceしておいて」と頼まれて、「スライス(薄切り)にダイス(角切り)ですね、お安いご用!」と、プリントアウトしたデータを片っ端からシュレッダーにかけてしまった・・・?

 

それはデータサイエンティストとしては致命的なミス。あなたの上司が求めていたのは、紙吹雪ではありません 笑

 

Wiktionaryによれば、slice and diceの意味は、「To rearrange or analyze in a number of different ways, often arbitrarily」(source)。大規模で複雑なデータがあったときに、いろいろな切り口(属性)によるフィルタリングなどを試すことで、分析・理解する、というようなニュアンスのフレーズです。目的語としては「データ」などがよく来ます。

 

実際の使用例を最近のニュース記事から探してみると、こんな感じ。

 

... to enable analysts to slice and dice large datasets by any combination of dimensions and measures.

(source)

 

... and lets account holders slice and dice the analytics data using various criteria, such as visitors' industry, geographical regions, professions and employers.

(source)

 

The city’s system will also spit out a handy spreadsheet file for use in Microsoft Excel or similar software, so anyone can slice and dice the data, analyze and share.

(source)

 

There are a wide range of arcane hedge-fund strategies, each one looking to slice and dice the financial markets in a different way.

(source)

 

 "We're looking at ways to re-slice and dice it to address [Tunney's] immediate concerns about the Cantilever approach to ...

(source)

 

※強調はすべて筆者による。

 

特定の手法に対する固有名詞、というような感じの説明をしている日本のサイトもありましたが、私はそういう用法は遭遇したことがないです。そういう名前の手法もあるのかもしれませんが、上の例からもわかるように、抽象的な使われ方のほうが多いと思います。

 

余談ですが、特定の手法名なのに曖昧な用語に誤用されてしまった例としては LSI (Latent Semantic Indexingが挙げられます。数年前の話ですが、LSI/LSAを使ってないにも関わらず、SEO業者が「LSI-based services」「LSI-based website optimization」などとわけのわからないバズワードをでっち上げていた時期がありました。IR研究者のEdel García氏がブログでこのテーマを何度か面白おかしく取り上げてるので、興味のある方はどうぞ。

関連記事:Latest SEO Incoherences (LSI) | IR Thoughts

 

 

slice and diceは、英辞郎など日本のオンライン辞書では現時点でまだ見受けられないフレーズですが、筆者もたまに聞くフレーズです。覚えておいて損はないでしょう。

 

ではまた次回!