ডাটা মাইনিং হল বিভিন্ন উৎস থেকে সংগৃহীত তথ্য কে বিশ্লেষণ করে ব্যবহার উপযোগী করে তোলা।
ডেটা মাইনিং কম্পিউটার বিজ্ঞানে অপেক্ষাকৃত একটি নতুন সংযোজন। পরিসংখ্যান এবং কৃত্রিম বুদ্ধিমত্তার প্রয়োগ করে বিপুল পরিমাণ উপাত্ত থেকে নতুন প্যাটার্ন আবিষ্কারের কাজটি করা হয় ডেটা মাইনিংয়ের মাধ্যমে।
 ডাটা মাইনিং এর লক্ষ্য হল একটি ডাটা সেট থেকে নির্দিষ্ট বা কাংক্ষিত ডাটা খুঁজে বের করা এবং তা নির্দিষ্ট কাজের উপযোগী করে বিন্যাস, শ্রেনীবদ্ধ ও উপস্থাপন করা।
ডাটা ডেটা মাইনিং ডেটাবেজ কমিউনিটিতে 1990 সালের দিকে এসেছিল।
1980-এর দশকের একটি সংক্ষিপ্ত সময়ের জন্য, “ডেটাবেস মাইনিং” ™ শব্দটি ব্যবহার করা হতো, কিন্তু এটি স্যান ডিয়েগো-ভিত্তিক কোম্পানীর এইচএনসি দ্বারা তৈরি করা হয়েছিল। 
শত শত বছর ধরে তথ্য থেকে প্যাটার্ন ম্যানুয়াি নিষ্কাশন করা হয়েছে। ডেটা সনাক্তকরণের প্রাথমিক পদ্ধতিগুলির মধ্যে রয়েছে Bayes’ theorem (1700s) এবং regression analysis (1800s)। কম্পিউটার প্রযুক্তির ক্রমবর্ধমান ক্ষমতা নাটকীয়ভাবে ডেটা সংগ্রহ, সঞ্চয় এবং ম্যানিপুলেশনের ক্ষমতা বৃদ্ধি করেছে। কম্পিউটার বিজ্ঞানের অন্যান্য আবিষ্কারগুলি যেমন, নিউরোলজিক্যাল নেটওয়ার্ক, cluster analysis, জেনেটিক অ্যালগোরিদম (1950) , decision trees এবং decision rules  (1960), এবং support vector machines (1990s)। ডেটা মাইনিং হল এই পদ্ধতিগুলি প্রয়োগ করে অনেক তথ্য থেকে একটা প্যাটার্ন বের করার প্রক্রিয়া । 



নলেজ ডিসকভারি ইন ডেটাবেসেজ (কেডিডি)এর ধাপগুলো সাধারণত নিম্নরূপঃ

  • সিলেকশন (বাছাইকরণ)
  • প্রি-প্রোসেসিং (পূর্ব-প্রক্রিয়াকরণ)
  • ট্রান্সফরমেশন (রূপান্তর)
  • ডাটা মাইনিং
  • এভালুয়েশন (মূল্যায়ন)


ডেটা মাইনিং এর জন্য ক্রস ইন্ডাস্ট্রিয়াল স্ট্যান্ডার্ড প্রসেস (সিআরএসপি-ডিএম) যাকে ছয়টি ধাপে সংজ্ঞায়িত করা যায়:

(1) Business Understanding

(2) Data Understanding
(3) Data Preparation
(4) Modeling
(5) Evaluation
(6) Deployment


ডেটা মাইনিং যেভাবে কাজ করেঃ 
নির্বাচন, প্রাক-প্রক্রিয়াকরণ, ট্রান্সফরমেশন, ডেটা মাইনিং, ইভালুয়েশন ইত্যাদি ধাপগুলোর মাধ্যমে পূর্ণাঙ্গ ডেটা মাইনিং সম্পন্ন করা হয়। কোনো কোনো ক্ষেত্রে এ ধাপগুলো আরও বিভক্ত করে অথবা ভিন্ন নামে বর্ণনা করা হয়। তবে সহজভাবে এ কাজটি তিনটি পর্যায়ে সম্পন্ন করা হয়। ১. প্রি প্রসেসিং ২. ডেটা মাইনিং এবং ৩. ফলাফল যাচাই।

প্রি প্রসেসিং: ডেটা মাইনিং অ্যালগরিদম প্রয়োগের আগে এ ধাপটি সম্পন্ন করতে হয়। ডেটা মাইনিংয়ের মাধ্যমে উপাত্ত ডেটাবেজ থেকে তথ্যের প্যাটার্ন খুঁজে বের করা হয়। তাই ডেটাবেজ নির্বাচনের ক্ষেত্রে একটি বিষয়ে লক্ষ রাখতে হবে যে এতে উপাত্তের পরিমাণ যেন খুব কম না হয়।
ডেটা মাইনিং: একাধিক মধ্যবর্তী ধাপে এ পর্যায়টি সম্পন্ন করা হয়। তথ্য যাচাই, আন্তসম্পর্ক খুঁজে বের করা, শ্রেণী বিভাগ, সংক্ষেপ ইত্যাদি কাজ সম্পন্ন করা হয় এখানে।
ফলাফল যাচাই: এ ধাপে ফলাফল যাচাইয়ের কাজটি করা হয়। ডেটা মাইনিংয়ের ফলাফল সঠিক কি না, এটি পরীক্ষা করা হয় অন্য কিছু অ্যালগরিদম প্রয়োগ করে।

ব্যবস্থা বাণিজ্যের ক্ষেত্রে এটি বর্তমানে ব্যাপকভাবে ব্যবহার করতে দেখা যাচ্ছে। ডেটা মাইনিং ব্যবহার করে রিটার্ন অন ইনভেস্টমেন্ট গণনা করা যায়, ফলে কোনো নতুন প্রকল্প শুরু করার আগে এটি ব্যবহার করা যেতে পারে। নতুন পণ্য গ্রাহকদের ব্যবহারের সম্ভাবনা, নতুন গ্রাহক সংগ্রহ করা, বর্তমান গ্রাহকেরা ছেড়ে যাবে কি না, সেটি জানার জন্য ব্যবহার করা হয় ডেটা মাইনিং পদ্ধতি। বাজারে পণ্যের চাহিদা যাচাই এবং কোনো নির্দিষ্ট পণ্যের ক্রেতা শ্রেণী সম্পর্কে জানতেও ব্যবহার করা হয় ডেটা মাইনিং। এ ছাড়া ডেটা মাইনিংয়ের কার্যকরী প্রয়োগ হলো অ্যাসোসিয়েশন রুল। এর মাধ্যমে বাজারে একটি পণ্য বিক্রির সঙ্গে অন্য এক বা একাধিক পণ্য বিক্রির সম্পর্ক খুঁজে বের করা যায়। এবং এর মাধ্যমে এ পণ্যের বিক্রি বাড়ানো যায়।
এ ছাড়া বায়োইনফরমেটিকস, জিন বিজ্ঞান, চিকিৎসা, শিক্ষা, প্রতিরক্ষাসহ বিজ্ঞানের প্রায় সব ক্ষেত্রে ডেটা মাইনিংয়ে প্রয়োগ করা হচ্ছে। প্রতিষ্ঠানে কর্মীদের দক্ষতা যাচাই অথবা নতুন নিয়োগের ক্ষেত্রেও এটি ব্যবহার করা যেতে পারে।

আইনশৃঙ্খলা রক্ষায় বরাবরই প্রযুক্তি ব্যবহারে এগিয়ে থাকে মার্কিন পুলিশ। এখন তারা পরীক্ষা করে দেখছে গুগল গ্লাসের মতোই-চশমা, কাপড়ে লাগিয়ে রাখার মতো ক্যামেরা আর ট্র্যাকিং ডিভাইস।অপরাধী খুঁজে বের করতে ডাটা মাইনিং, পূর্বাভাস বিশ্লেষণ আর সবধরনের যন্ত্রপাতি ব্যবহারের পথে হাঁটছে তারা।



Similar Posts:

    None Found

Facebook Comments

খুবই সাধারণ সাধাসিধে একজন মানুষ। টেকনোলজি ভালবাসি , ভালবাসি নতুন কিছু শিখতে। আর বিশ্বাস করি শেখানটাই শেখার সবথেকে ভালো মাধ্যম।

Leave a Reply

Your email address will not be published.