Blogger Tips and TricksLatest Tips And TricksBlogger Tricks

Friday, July 17, 2015

हडूप टेक्नोलॉजी :Hadoop Technology a Solution for Big Data

SHARE

 " आज के समय में विभिन्न साइट्स जैसे फेसबुक, ट्विटर,याहू आदि  पर डाटा बहुत तेजी से बढ़ रहा है। अपने ग्राहकों का  विश्वास   बनाये रखने एवं उनको संतुष्ट बनाये रखने के  लिए ये कंपनिया नयी नयी टेक्नोलॉजी का उपयोग कर रही हैं जिनकी मदद से करोडो और अरबो ग्राहकों एवं प्रयोगकर्ताओं की डेटा को सही से व्यवस्थ्तित किया जा सके। ऐसे में अब तक  डेटा माइनिंग , डेटा वेयरहाउस जैसी तकनीको का उपयोग करके अक्सर बिग डेटा को हैंडल किया जाता रहा है किन्तु वर्तमान समय में अपनी गुणवत्ता के कारण हडूप टेक्नोलॉजी भी बिग डेटा को हैंडल करने के लिए प्रयोग होने लगी है।  "


वर्तमान समय में डिस्टीब्यूटेड डेटा को सही तरीके से स्टोर करना एवं प्रयोगकर्ता या ग्राहक  की आवश्यकता की अनुसार उसको उपलब्ध कराना कम्पनियो के लिए  बहुत जरूरी बन गया है।  बैंक द्वारा ए.टी.एम मशीन की माध्यम से ग्राहक को किसी भी समय , किसी भी लोकेशन से  धन उपब्ध करना , खाते से सम्बंधित सेवा उपलब्ध करना डिस्ट्रिब्यूटेड सिस्टम  का  एक उदाहरण   है। इसके अन्य उदाहरण सोशल नेटवर्किंग साइट द्वारा प्रयोगकर्ता को  उपलब्ध करने वाली सेवाएं हैं।




हडूप  परिचय 

हडूप एक ओपन सोर्स सॉफ्टवेयर फ्रेमवर्क है, जिसको JAVA प्रोग्रामिंग लैंग्वेज में बनाया  गया है।  हडूप अलग अलग स्थानो  पर मौजूद कंप्यूटर पर एवं कंप्यूटर के समहुओ  पर मौजूद बड़े  डेटा को डिस्ट्रिब्यूटेड तरीके से स्टोर करने और  प्रोसेसिंग करने की लिए  प्रयोग किया जाता है।  यह फाइल सिस्टम पर आधारित है।  जिसकी मदद से डेटा के कुछ मुख्य पैरामीटर के आधार पर  डेटा की जांच ,उसकी एनालिसिस  की  क्रिया को  तेज और उत्तम बनाया  जाता है।  इसकी  मदद से  बिग डाटा को डिसिजन मेकिंग के लिए किसी ग्राफ एवं चार्ट के रूप में आसानी से दिखाया  जा सकता है।   यह मुख्यत उन वेब साइट्स के द्वारा डेटा को सही तरीके से व्यवस्थित करने के लिए प्रयोग किया जाता है जिनका डेटाबेस काफी बड़ा होता है।

हडूप  फ्रेमवर्क

हडूप  फ्रेमवर्क में मुख्यता निम्नन भाग होते हैं

Hadoop Distributed File System : यह डेटा को कंप्यूटर और उनके समहू पर  कुशलतापूर्वक स्टोर करता है।  साथ ही साथ प्रयोगकर्ता की जरूरत के समय  इस डेटा का प्रयोगकर्ता को कम  समय में उपलब्ध भी कराता  है। 

Hadoop MapReduce : यह एक प्रोग्रामिंग मॉड्यूल  है , जो की मुख्यता डेटा के बड़े बड़े सेट की पैरेलल प्रोसेसिंग के लिए प्रयोग होता है। 

 Hadoop YARN: यह मुख्यता : हडूप फ्रेमवर्क में उपस्थित सभी साधनो , सभी टूल्स को आवश्यकता अनुसार व्यवस्तित करता है उनका प्रबंधन करता है। यह फ्रेमवर्क में मौजूद  साधनो और टूल्स की मदद से डेटा सेट और कंप्यूटर के समहुओ  का प्रबंधन भी करता है और कब किस प्रयोगकर्ता को , किस कंप्यूटर समहू का कौन सा डेटा उपलब्ध कराना  है उसकी सूची (Scheduling ) तैयार करता है। 

Hadoop Common : यह उन सभी फाइल्स एवं  यूटिलिटीज को उपलब्ध करता है जो फ्रेमवर्क में एक दुसरे को सपोर्ट करती हैं।  जिनकी जरूरत डेटा की प्रोसेसिंग की दौरान पड़ती है।  

हडूप फ्रेमवर्क सॉफ्टवेयर कंपनी अपाचे  (Apache Software Foundation ) द्वारा तैयार किया गया है।  बड़े डेटा बेस वाली  वेबसाइट  वाली कंपनी जहा पर की करोडो  और अरबो प्रयोगकर्ताओं का डेटा स्टोर होता है , वह वर्तमान समय में हडूप  टेक्नोलॉजी का उपयोग कर रही हैं जिनमे फेसबुक एवं याहू जैसी बड़ी कंपनिया भी शामिल हैं। हडूप  फ्रेमवर्क को सबसे पहले  दिसंबर 2011  में मार्केट  में उतारा गया।  हाल ही में 21  अप्रैल 2015  को इसका नया वर्जन  रिलीज़ हुआ है। 

4 comments:

  1. Manoj, thanks for writing such a useful technical article.

    ReplyDelete
  2. Very nice post ...
    Welcome to my blog on my new post.

    ReplyDelete
  3. This is really an awesome article. Thank you for sharing this.It is worth reading for everyone.


    Bigdata Hadoop Training

    ReplyDelete
  4. WOW! Really Nice Post! I personally believe that to maintain the standard of a blog all the hacks mentioned above are important. All points discussed were worth reading and I’ll surely work with the all one by one.

    Hadoop Training in Chennai

    ReplyDelete

अगर आपको पोस्ट पसंद आये तो कृपया ब्लॉग का अनुसरण करें और पोस्ट पर टिप्पणी के रूप में अपने सुझाव दे !

Recent Posts