การจัดเก็บและการค้นคืนสารสนเทศ

การจัดเก็บและการค้นคืนสารสนเทศ การจัดเก็บและการค้นคืนสารสนเทศมีลักษณะโครงสร้างที่มีส่วนติดต่อผู้ใช้ที่อำนวยความสะดวกในการสร้างการค้นหาและการเปลี่ยนของข้อมูลที่เก็บไว้ISRS โดยปกติจะเป็นเครือข่ายการใช้งานโดยเอกชนหรือองค์กรอิสระแต่สามารถให้เข้าถึงได้แก่ประชาชนทั่วไปบางส่วนสามารถเข้าถึงได้จากอินเตอร์เน็ตที่ใหญ่ที่สุดในโลกคือ internet นั่นเอง
ความแตกต่างระหว่าง ISO และระบบจัดการฐานข้อมูล dbms คือ isr มีไว้สำหรับประชาชนทั่วไปในขณะที่ดี mbs จะกำหนดสิทธิ์จำกัดเข้าถึงแก่ผู้ใช้ที่ได้รับอนุญาตนอกจากนี้ isr ได้มีการจัดการแบบรวมศูนย์เหมือน dbms

การจัดเก็บสารสนเทศ

การจัดเก็บสารสนเทศการคัดเลือกและจัดหาสารสนเทศที่ตรงกับความต้องการของผู้ใช้และมีการควบคุมโครงสร้างสารสนเทศวิเคราะห์เนื้อหาทำรายการและดัชนีจนกลายเป็นตัวแทนเอกสารหรือระเบียนจัดเก็บไว้ในฐานข้อมูล

การค้นคืนสารสนเทศ

การสืบค้นสารสนเทศกระบวนการหรือการกระทำเพื่อให้ได้รับสารสนเทศที่มีเนื้อหาที่ต้องการจากแหล่งที่รวบรวมสารสนเทศไว้กับคืนมาโดยมีเครื่องมือสืบค้นให้ผู้ใช้ค้นหาได้อย่างรวดเร็ว การค้นหาสามารถทำโดยใช้ตัวอักษรหรือเมตาดาต้าคือข้อมูลที่ใช้กำกับและอธิบายข้อมูลหลักหรือกลุ่มของข้อมูลอื่นตัวอย่างเช่นบัตรในห้องสมุดสำหรับสืบค้นหนังสือหรือในรูปแบบการจัดทำดัชนีอื่นๆ
การค้นคืนสารสนเทศทำได้ 2 วิธีคือ
1 การค้นคืนด้วยเครื่องมือที่ ไม่ใช่คอมพิวเตอร์อาจจะกระทำด้วยระบบมือเครื่องมือหรือโมเดลต่างๆซึ่งเป็นเอกสารที่เป็นกระดาษการ์ดดัชนีหรือบรรณานุกรมซึ่งเก็บรายละเอียดสารสนเทศที่ต้องการค้นหาไว้
2.การค้นคืนด้วยระบบคอมพิวเตอร์ เป็นการค้นคืนที่กระทำผ่านเครื่องคอมพิวเตอร์หรือกลไกที่เกี่ยวข้องกับคอมพิวเตอร์เช่นระบบฐานข้อมูลเอกสารอิเล็กทรอนิกส์และบริการสืบค้นบนอินเตอร์เน็ตเป็นต้น ขั้นตอนการค้นคืนสารสนเทศ เริ่มต้นขึ้นเมื่อผู้ใช้ป้อนการสอบถามเข้ามาในระบบข้อความที่สอบถามจากคล้ายเป็นคำหลักที่ต้องการค้นหาเพื่อส่งไปตรวจสอบในระบบที่เก็บสารสนเทศนั้นนั้นโดยพิจารณาเงื่อนไขที่ตรงกับที่ค้นคืนและให้ผลลัพธ์ที่ตรงหรือใกล้เคียงที่สุดออกมาในการค้นคืนอาจจะดึงสารสนเทศจาก เพียงแหล่งภายในเพียงอย่างเดียวแต่จะเข้าถึงแหล่งสารสนเทศภายนอกและอื่นที่เกี่ยวข้องด้วย แต่บ่อยครั้งสารสนเทศที่ต้องการอาจเป็นข้อความภาพเสียงหรือวิดีโอสารสนเทศที่ค้นหาไม่ได้มีเก็บไว้หรือไม่ได้เก็บไว้โดยตรงในระบบอาญา แต่จะถูกแสดงในรูปของเมตตาดีต้าแทน ส่วนใหญ่ระบบ ir มีการนับจำนวนครั้งเมื่อสารสนเทศถูกค้นพบด้วยอัลกอริทึมเฉพาะเก็บค่าเป็นตัวเลขกว่าที่สืบค้นนั้นตรงกับในระบบหรือไม่แล้วจัดลำดับของคำที่ค้นหาเก็บไว้เป็นค่าลำดับการจัดลำดับบนๆจะแสดงให้เห็นถึงคำตอบที่ดีที่สุดและเกี่ยวข้องที่สุดแล้วจึงแสดงให้ผู้ใช้ทราบถึงสารสนเทศตามลำดับคะแนนที่ค้นพบ

เทคนิคในการสืบค้นสารสนเทศ

สามารถใช้เทคนิค 5W1H ที่ใช้ในการวิเคราะห์ปัญหามาเป็นตัวสร้างคำสืบค้นได้ ดังนี้
1.Who คือ ต้องการสืบหาเกี่ยวกับใครหรือกลุ่มเป้าหมายใด
2.What คือ ต้องการสารสนเทศอะไร ประเภทใด หรือสารสนเทศรูปแบบใด จำนวนเท่าไร
3.When คือ ระยะเวลาที่ต้องการใช้สารสนเทศอยู่ในช่วงเวลาใด เก่าหรือใหม่ตามที่กำหนด มีการเปลี่ยนแปลงเร็วหรือไม่
4.Where คือ สารสนเทศเกิดขึ้นที่ใด หรือเก็บไว่ที่ใด
5.Why คือ ค้นหาสารสนเทศเพื่ออะไร
6.How คือ สามารถทำให้บรรลุ What ในข้างต้นได้อย่างไร
กลยุทธ์ในการค้นหาเบื้องต้น
การค้นคืนหรือสืบค้นสารสนเทศมีโปรแกรมหรือเครื่องมือที่ช่วยให้การค้นคืนได้ตรงตามความต้องการมากที่สุดและอำนวยความสะดวกแก่ผู้ใช้โดยตัวเครื่องมือจะมีคุณสมบัติในการค้นคืนแตกต่างกันออกไปเช่น keyword Boolean Operators และการตัดคำ เป็นต้น เครื่องมือจะช่วยให้สามารถสร้างการค้นหาที่จะมุ่งเน้นไปยังข้อมูลที่เกี่ยวข้องรวมไปถึงการค้นหาด้วย keyword และเรื่อง Subject ตัวดำเนินการ Boolean Operators การตัดคำการค้นหาวลีการค้นหาแบบจำกัดขอบเขตและการค้นหาแบบวนลูป (nesting) การทำความเข้าใจเกี่ยวกับเทคนิคเหล่านี้จะช่วยให้สามารถค้นหาได้อย่างมีประสิทธิภาพ
1.การค้นหาด้วยคำหลักหรือคำสำคัญ คอมพิวเตอร์จะทำดัชนีคำที่สำคัญไว้ในฐานข้อมูลเช่นชื่อเรื่องผลสรุปแม้กระทั่งส่วนของข้อความในระเบียนหรือบทความไว้ใช้เป็นคำเพื่อค้นหาเมื่อพิมพ์คำเหล่านี้ส่งในหน้าต่างการค้นหาในฐานข้อมูลเราเรียกการค้นหานี้ว่า การค้นหาคำหลัก
2.การค้นหาด้วยวลีการค้นหาด้วยวลี เป็นวิธีที่จะดึงระเบียนที่มีวลีเฉพาะเจาะจงในการค้นหาวรีนั้นฐานข้อมูลส่วนใหญ่ต้องใช้เครื่องหมายคำพูดปิดและเปิดข้อความว่าลีการค้นหาวรีจะค้นหาเฉพาะระเบียนที่มีคำตอบลำดับนั้นๆ
3.การค้นหาด้วยชื่อเรื่อง การค้นหาด้วยชื่อเรื่องจะค้นหาข้อมูลชื่อเรื่องจากระเบียนที่บันทึกในฐานข้อมูลระเบียนในฐานข้อมูลจะถูกมอบหัวเรื่องจากพจนานุกรมที่รวมคำศัพท์ความหมายใกล้เคียงกันในฐานข้อมูลเมื่อพจนานุกรมสามารถใช้ได้ก็จะช่วยจัดหาชื่อเรื่องและเสนอเงื่อนไขการค้นหาที่แคบลง หัวข้อที่กว้างขึ้นหรือเรื่องในสาขาที่เกี่ยวข้อง
4.และ - หรือ - ไม่ตั้งชื่อตามนักคณิตศาสตร์ชาวอังกฤษสอน Blue ซึ่งสามารถวางอยู่ระหว่างคำค้นหาเพื่อให้ความหมายแคบหรือขยายการค้นหาหรือเพื่อที่จะไม่รวมคำที่ต้องการค้นหา
5.การค้นหาคำด้วยการตัดคำ การเพิ่มสัญลักษณ์บางอย่างเรียกว่าสัญลักษณ์ตัวแทนต่อท้ายคำการตัดคำช่วยให้สามารถค้นหารากของคำเพื่อจะหาส่วนสุดท้ายของคำที่แตกต่างกันไปสัญลักษณ์ที่พบมากที่สุดคือเครื่องหมายดอกจันซึ่งบางฐานข้อมูลอาจใช้สัญลักษณ์ที่แตกต่างกันเพื่อตรวจสอบและหาสัญลักษณ์ที่ถูกต้อง
6.การค้นหาคำด้วยคำจำกัด ฐานข้อมูลจำนวนมากและเครื่องมือค้นหาช่วยให้สามารถจำกัดการค้นหาที่เฉพาะเจาะจงเช่นรูปแบบภาษาวันที่พิมพ์เป็นต้น
7.การค้นหาแบบการซับซ้อนใน ฐานข้อมูลส่วนใหญ่ยอมให้มีการสอบถามข้อมูลที่ซับซ้อนมากตัวอย่างเช่นการทำ nesting ช่วยให้ใส่วงเล็บ String ซ้อนกันกับการใช้ boolean ไปด้วย

เครื่องมือช่วยสืบค้นข้อมูลบนอินเทอร์เน็ต

  เครื่องมือช่วยการค้นหาข้อมูลบนอินเทอร์เน็ตที่สำคัญ คือ เสิร์ชเอนจิน  (Search Engine) ความหมาย การทำงาน และประเภทของเสิร์ชเอนจินมีดังนี้
1.ความหมายของเสิร์ชเอนจิน
       เสิร์ชเอนจิน (Search Engine) หรือ โปรแกรมค้นหา คือ โปรแกรมที่ออกแบบมาเป็นเครื่องมือสำหรับใช้ ค้นหาข้อมูล ซึงโปรแกรมที่ใช้สำหรับคนหาข้อมูลบนเว็บไซต์ หรือ เว็บไซต์ที่ใช้สำหรับค้นหาข้อมูล เราจะเรียกว่า Web Search Engine ( เว็บเสิร์ชเอนจิน ) ครับ Search engine ส่วนใหญ่จะค้นหาข้อมูลโดยที่เราต้อง กรอก ข้อมูลที่ต้องการค้นหา หรือ คำค้นหาต่างๆลงไป ซึ่งคำเหล่านั้นเราจะเรียกว่า Keyword (คีย์เวิร์ด) ซึ่งผลลัพธ์จะต้องการก็จะแสดงผลมาให้ทางผู้ค้นหาทราบ ในปัจจุบัน Search Engine บางตัว จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย และจะนำประวัติที่บันทึกไว้นั้น มาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อ ๆ ไป ซึ่งข้อดีจะช่วยการค้นหานั้นประสบความสำเร็จ ได้ข้อมูลที่ตรงกับ Keyword มากที่สุด
2.ลักษณะของเสิร์ชเอนจิน
       คือโปรแกรมสืบค้นข้อมูลในอินเทอร์เน็ตชนิดหนึ่งโดยโปรแกรมจะรวบรวมข้อมูลและแยกจัดเก็บเว็บไว้ในฐานข้อมูลตามประเภทข้อหัวข้อของเว็บเมื่อผู้ใช้ค้นหา จะสามารถเข้าไปดูตามหัวข้อต่างๆและดูหัวข้อย่อยเข้าไปอีกจนกว่าจะพบหัวข้อหรือเรื่องที่ต้องการ ตัวอย่างเช่น catalog based search engine คือ gmo Z Yahoo เป็นต้นซึ่งจะต่างกับชีวิต desk search engine ที่ต้องพิมพ์คำค้นหาเพื่อตรวจสอบกับฐานข้อมูลว่ามีข้อมูลนี้หรือไม่ถ้ามีจะแสดงรายชื่อขึ้นออกมา
3.ประเภทของเสิร์ชเอนจิน
Search Engine สามารถแบ่งออกได้เป็น 3 ประเภท โดยมีความแตกต่างกันที่หลักการทำงาน และการจัดอันดับข้อมูลในการค้นหา
  1. Crawler Based Search Engines คือ เครื่องมือที่ใช้สำหรับการสืบค้นข้อมูลบนเครือข่ายอินเทอร์เน็ต ซึ่ง Search Engines ชนิดนี้เป็นประเภทที่ได้รับความนิยมในการใช้งานสูงสุด มีหลักการทำงานโดยการบันทึกและจัดเก็บข้อมูลต่างๆ สามารถให้ผลลัพธ์การค้นหาที่มีความแม่นยำสูง และมีการประมวลผลที่รวดเร็ว จึงเป็นเหตุผลที่ทำให้ในปัจจุบัน Crawler Based Search Engines มีบทบาทในการสืบค้นข้อมูลมากที่สุด
  2. Web Directory คือ สารบัญเว็บไซต์สำหรับการสืบค้นข้อมูลข่าวสาร ที่มีการจัดระเบียบและแบ่งข้อมูลต่างๆ ไว้เป็นหมวดหมู่ ผู้สืบค้นจึงสามารถใช้งานได้ง่ายและมีความสะดวกในการค้นหา โดยในการค้นหาจะมีการสร้างดรรชนี และระบุหมวดหมู่ไว้อย่างชัดเจน ทำให้ในขณะที่กำลังทำการค้นหาข้อมูลต่างๆ ในหมวดหมู่หนึ่ง ที่อาจมีเนื้อหาคล้ายกันมากมายหลายเว็บไซต์ ผู้สืบค้นสามารถนำข้อมูลที่ได้จากการประมวลผลมาเปรียบเทียบ และอ้างอิงเพื่อค้นหาข้อเท็จจริงที่มีคุณภาพ และตรงประเด็นมากที่สุดได้
  3. Meta Search Engine คือ เครื่องมือที่ใช้สำหรับการสืบค้นข้อมูลบนเครือข่ายอินเทอร์เน็ต มีหลักการทำงานโดยการอาศัย Meta Tag สำหรับประกาศชุดคำสั่งที่ได้รับมาในรูปแบบของ Tex Editor โดยใช้ภาษา HTML ในการประมวลผลลัพธ์ ตัวอย่างเช่น คำค้นหา “บริษัท วันบีลีฟ” หรือคำอธิบายเว็บไซต์ เป็นต้น ซึ่ง Search Engine ชนิดดังกล่าวนี้ เป็นชนิดที่มีความแม่นยำในการค้นหาค่อนข้างต่ำ เนื่องจากสามารถถูกแก้ไขและออกแบบได้โดยผู้ให้บริการ เพื่อให้บล็อกหรือเว็บไซต์ของตนเองสามารถค้นพบได้ง่ายขึ้น