ডাটা মাইনিং > প্রযুক্তির দারুন এক সমন্বয়

ডাটা মাইনিং হল বিভিন্ন উৎস থেকে সংগৃহীত তথ্য কে বিশ্লেষণ করে ব্যবহার উপযোগী করে তোলা।
ডেটা মাইনিং কম্পিউটার বিজ্ঞানে অপেক্ষাকৃত একটি নতুন সংযোজন। পরিসংখ্যান এবং কৃত্রিম বুদ্ধিমত্তার প্রয়োগ করে বিপুল পরিমাণ উপাত্ত থেকে নতুন প্যাটার্ন আবিষ্কারের কাজটি করা হয় ডেটা মাইনিংয়ের মাধ্যমে।
 ডাটা মাইনিং এর লক্ষ্য হল একটি ডাটা সেট থেকে নির্দিষ্ট বা কাংক্ষিত ডাটা খুঁজে বের করা এবং তা নির্দিষ্ট কাজের উপযোগী করে বিন্যাস, শ্রেনীবদ্ধ ও উপস্থাপন করা।
ডাটা ডেটা মাইনিং ডেটাবেজ কমিউনিটিতে 1990 সালের দিকে এসেছিল।
1980-এর দশকের একটি সংক্ষিপ্ত সময়ের জন্য, "ডেটাবেস মাইনিং" ™ শব্দটি ব্যবহার করা হতো, কিন্তু এটি স্যান ডিয়েগো-ভিত্তিক কোম্পানীর এইচএনসি দ্বারা তৈরি করা হয়েছিল। 
শত শত বছর ধরে তথ্য থেকে প্যাটার্ন ম্যানুয়াি নিষ্কাশন করা হয়েছে। ডেটা সনাক্তকরণের প্রাথমিক পদ্ধতিগুলির মধ্যে রয়েছে Bayes' theorem (1700s) এবং regression analysis (1800s)। কম্পিউটার প্রযুক্তির ক্রমবর্ধমান ক্ষমতা নাটকীয়ভাবে ডেটা সংগ্রহ, সঞ্চয় এবং ম্যানিপুলেশনের ক্ষমতা বৃদ্ধি করেছে। কম্পিউটার বিজ্ঞানের অন্যান্য আবিষ্কারগুলি যেমন, নিউরোলজিক্যাল নেটওয়ার্ক, cluster analysis, জেনেটিক অ্যালগোরিদম (1950) , decision trees এবং decision rules  (1960), এবং support vector machines (1990s)। ডেটা মাইনিং হল এই পদ্ধতিগুলি প্রয়োগ করে অনেক তথ্য থেকে একটা প্যাটার্ন বের করার প্রক্রিয়া । 


নলেজ ডিসকভারি ইন ডেটাবেসেজ (কেডিডি)এর ধাপগুলো সাধারণত নিম্নরূপঃ
  • সিলেকশন (বাছাইকরণ)
  • প্রি-প্রোসেসিং (পূর্ব-প্রক্রিয়াকরণ)
  • ট্রান্সফরমেশন (রূপান্তর)
  • ডাটা মাইনিং
  • এভালুয়েশন (মূল্যায়ন)


ডেটা মাইনিং এর জন্য ক্রস ইন্ডাস্ট্রিয়াল স্ট্যান্ডার্ড প্রসেস (সিআরএসপি-ডিএম) যাকে ছয়টি ধাপে সংজ্ঞায়িত করা যায়:

(1) Business Understanding
(2) Data Understanding
(3) Data Preparation
(4) Modeling
(5) Evaluation
(6) Deployment

ডেটা মাইনিং যেভাবে কাজ করেঃ 
নির্বাচন, প্রাক-প্রক্রিয়াকরণ, ট্রান্সফরমেশন, ডেটা মাইনিং, ইভালুয়েশন ইত্যাদি ধাপগুলোর মাধ্যমে পূর্ণাঙ্গ ডেটা মাইনিং সম্পন্ন করা হয়। কোনো কোনো ক্ষেত্রে এ ধাপগুলো আরও বিভক্ত করে অথবা ভিন্ন নামে বর্ণনা করা হয়। তবে সহজভাবে এ কাজটি তিনটি পর্যায়ে সম্পন্ন করা হয়। ১. প্রি প্রসেসিং ২. ডেটা মাইনিং এবং ৩. ফলাফল যাচাই।

প্রি প্রসেসিং: ডেটা মাইনিং অ্যালগরিদম প্রয়োগের আগে এ ধাপটি সম্পন্ন করতে হয়। ডেটা মাইনিংয়ের মাধ্যমে উপাত্ত ডেটাবেজ থেকে তথ্যের প্যাটার্ন খুঁজে বের করা হয়। তাই ডেটাবেজ নির্বাচনের ক্ষেত্রে একটি বিষয়ে লক্ষ রাখতে হবে যে এতে উপাত্তের পরিমাণ যেন খুব কম না হয়।
ডেটা মাইনিং: একাধিক মধ্যবর্তী ধাপে এ পর্যায়টি সম্পন্ন করা হয়। তথ্য যাচাই, আন্তসম্পর্ক খুঁজে বের করা, শ্রেণী বিভাগ, সংক্ষেপ ইত্যাদি কাজ সম্পন্ন করা হয় এখানে।
ফলাফল যাচাই: এ ধাপে ফলাফল যাচাইয়ের কাজটি করা হয়। ডেটা মাইনিংয়ের ফলাফল সঠিক কি না, এটি পরীক্ষা করা হয় অন্য কিছু অ্যালগরিদম প্রয়োগ করে।

ব্যবস্থা বাণিজ্যের ক্ষেত্রে এটি বর্তমানে ব্যাপকভাবে ব্যবহার করতে দেখা যাচ্ছে। ডেটা মাইনিং ব্যবহার করে রিটার্ন অন ইনভেস্টমেন্ট গণনা করা যায়, ফলে কোনো নতুন প্রকল্প শুরু করার আগে এটি ব্যবহার করা যেতে পারে। নতুন পণ্য গ্রাহকদের ব্যবহারের সম্ভাবনা, নতুন গ্রাহক সংগ্রহ করা, বর্তমান গ্রাহকেরা ছেড়ে যাবে কি না, সেটি জানার জন্য ব্যবহার করা হয় ডেটা মাইনিং পদ্ধতি। বাজারে পণ্যের চাহিদা যাচাই এবং কোনো নির্দিষ্ট পণ্যের ক্রেতা শ্রেণী সম্পর্কে জানতেও ব্যবহার করা হয় ডেটা মাইনিং। এ ছাড়া ডেটা মাইনিংয়ের কার্যকরী প্রয়োগ হলো অ্যাসোসিয়েশন রুল। এর মাধ্যমে বাজারে একটি পণ্য বিক্রির সঙ্গে অন্য এক বা একাধিক পণ্য বিক্রির সম্পর্ক খুঁজে বের করা যায়। এবং এর মাধ্যমে এ পণ্যের বিক্রি বাড়ানো যায়।
এ ছাড়া বায়োইনফরমেটিকস, জিন বিজ্ঞান, চিকিৎসা, শিক্ষা, প্রতিরক্ষাসহ বিজ্ঞানের প্রায় সব ক্ষেত্রে ডেটা মাইনিংয়ে প্রয়োগ করা হচ্ছে। প্রতিষ্ঠানে কর্মীদের দক্ষতা যাচাই অথবা নতুন নিয়োগের ক্ষেত্রেও এটি ব্যবহার করা যেতে পারে।

আইনশৃঙ্খলা রক্ষায় বরাবরই প্রযুক্তি ব্যবহারে এগিয়ে থাকে মার্কিন পুলিশ। এখন তারা পরীক্ষা করে দেখছে গুগল গ্লাসের মতোই-চশমা, কাপড়ে লাগিয়ে রাখার মতো ক্যামেরা আর ট্র্যাকিং ডিভাইস।অপরাধী খুঁজে বের করতে ডাটা মাইনিং, পূর্বাভাস বিশ্লেষণ আর সবধরনের যন্ত্রপাতি ব্যবহারের পথে হাঁটছে তারা।



No comments

বিটকয়েন - নতুন ধারা

বিটকয়েন হচ্ছে এক ধরনের সাংকেতিক মুদ্রা (Virtual Currency) যেটি ক্রিপ্টোগ্রাফিক প্রোটকলের মাধ্যমে লেনদেন করা হয়ে থাকে। এটি লেনদেন নিয়ন্ত্রণ...

Theme images by enjoynz. Powered by Blogger.