" आज के समय में विभिन्न साइट्स जैसे फेसबुक, ट्विटर,याहू आदि पर डाटा बहुत तेजी से बढ़ रहा है। अपने ग्राहकों का विश्वास बनाये रख...
" आज के समय में विभिन्न साइट्स जैसे फेसबुक, ट्विटर,याहू आदि पर डाटा बहुत तेजी से बढ़ रहा है। अपने ग्राहकों का विश्वास बनाये रखने एवं उनको संतुष्ट बनाये रखने के लिए ये कंपनिया नयी नयी टेक्नोलॉजी का उपयोग कर रही हैं जिनकी मदद से करोडो और अरबो ग्राहकों एवं प्रयोगकर्ताओं की डेटा को सही से व्यवस्थ्तित किया जा सके। ऐसे में अब तक डेटा माइनिंग , डेटा वेयरहाउस जैसी तकनीको का उपयोग करके अक्सर बिग डेटा को हैंडल किया जाता रहा है किन्तु वर्तमान समय में अपनी गुणवत्ता के कारण हडूप टेक्नोलॉजी भी बिग डेटा को हैंडल करने के लिए प्रयोग होने लगी है। "
वर्तमान समय में डिस्टीब्यूटेड डेटा को सही तरीके से स्टोर करना एवं प्रयोगकर्ता या ग्राहक की आवश्यकता की अनुसार उसको उपलब्ध कराना कम्पनियो के लिए बहुत जरूरी बन गया है। बैंक द्वारा ए.टी.एम मशीन की माध्यम से ग्राहक को किसी भी समय , किसी भी लोकेशन से धन उपब्ध करना , खाते से सम्बंधित सेवा उपलब्ध करना डिस्ट्रिब्यूटेड सिस्टम का एक उदाहरण है। इसके अन्य उदाहरण सोशल नेटवर्किंग साइट द्वारा प्रयोगकर्ता को उपलब्ध करने वाली सेवाएं हैं।
Also Read - Data Structure Notes for CS Students
हडूप परिचय
हडूप एक ओपन सोर्स सॉफ्टवेयर फ्रेमवर्क है, जिसको JAVA प्रोग्रामिंग लैंग्वेज में बनाया गया है। हडूप अलग अलग स्थानो पर मौजूद कंप्यूटर पर एवं कंप्यूटर के समहुओ पर मौजूद बड़े डेटा को डिस्ट्रिब्यूटेड तरीके से स्टोर करने और प्रोसेसिंग करने की लिए प्रयोग किया जाता है। यह फाइल सिस्टम पर आधारित है। जिसकी मदद से डेटा के कुछ मुख्य पैरामीटर के आधार पर डेटा की जांच ,उसकी एनालिसिस की क्रिया को तेज और उत्तम बनाया जाता है। इसकी मदद से बिग डाटा को डिसिजन मेकिंग के लिए किसी ग्राफ एवं चार्ट के रूप में आसानी से दिखाया जा सकता है। यह मुख्यत उन वेब साइट्स के द्वारा डेटा को सही तरीके से व्यवस्थित करने के लिए प्रयोग किया जाता है जिनका डेटाबेस काफी बड़ा होता है।
हडूप फ्रेमवर्क
हडूप फ्रेमवर्क में मुख्यता निम्नन भाग होते हैं
Hadoop Distributed File System : यह डेटा को कंप्यूटर और उनके समहू पर कुशलतापूर्वक स्टोर करता है। साथ ही साथ प्रयोगकर्ता की जरूरत के समय इस डेटा का प्रयोगकर्ता को कम समय में उपलब्ध भी कराता है।
Hadoop MapReduce : यह एक प्रोग्रामिंग मॉड्यूल है , जो की मुख्यता डेटा के बड़े बड़े सेट की पैरेलल प्रोसेसिंग के लिए प्रयोग होता है।
Hadoop YARN: यह मुख्यता : हडूप फ्रेमवर्क में उपस्थित सभी साधनो , सभी टूल्स को आवश्यकता अनुसार व्यवस्तित करता है उनका प्रबंधन करता है। यह फ्रेमवर्क में मौजूद साधनो और टूल्स की मदद से डेटा सेट और कंप्यूटर के समहुओ का प्रबंधन भी करता है और कब किस प्रयोगकर्ता को , किस कंप्यूटर समहू का कौन सा डेटा उपलब्ध कराना है उसकी सूची (Scheduling ) तैयार करता है।
Hadoop Common : यह उन सभी फाइल्स एवं यूटिलिटीज को उपलब्ध करता है जो फ्रेमवर्क में एक दुसरे को सपोर्ट करती हैं। जिनकी जरूरत डेटा की प्रोसेसिंग की दौरान पड़ती है।
हडूप फ्रेमवर्क सॉफ्टवेयर कंपनी अपाचे (Apache Software Foundation ) द्वारा तैयार किया गया है। बड़े डेटा बेस वाली वेबसाइट वाली कंपनी जहा पर की करोडो और अरबो प्रयोगकर्ताओं का डेटा स्टोर होता है , वह वर्तमान समय में हडूप टेक्नोलॉजी का उपयोग कर रही हैं जिनमे फेसबुक एवं याहू जैसी बड़ी कंपनिया भी शामिल हैं। हडूप फ्रेमवर्क को सबसे पहले दिसंबर 2011 में मार्केट में उतारा गया। हाल ही में 21 अप्रैल 2015 को इसका नया वर्जन रिलीज़ हुआ है।
Also Read - Tree Traversal in Data Structure
COMMENTS