Search Engines มีประโยชน์ในการใช้สืบค้นข้อมูลที่ต้องการทราบได้อย่างสะดวก รวดเร็วและมีประสิทธิภาพสูง สามารถใช้งานได้ตลอดเวลา รวมทั้งให้ผลลัพธ์ที่ตรงกับความตรงการแก่ผู้สืบค้นข้อมูล ดังนั้นการสร้างและออกแบบเว็บไซต์ใหม่ๆ ในในปัจจุบันจึงควรคำนึงถึงรูปแบบของเว็บไซต์ให้มีความเหมาะสมแก่ Search Engine ด้วยเช่นกัน (เรียกว่าการทำ SEO) เพื่อให้ผู้สืบค้นสามารถค้นหาข้อมูลที่ต้องการได้ง่ายมากยิ่งขึ้น วิธีการสืบค้นข้อมูลบนเว็บไซต์ การสืบค้นข้อมูลด้วย Search Engine ตัวอย่าง Web Search Engine การสืบค้นเว็บไซต์ข้อมูลด้วย Search Engine 1. ทำการเปิดเว็บไซต์ที่ให้บริการ http://www.google.co.th/ การสืบค้นรูปภาพด้วย Search Engine 1. ทำการเปิดเว็บไซต์ที่ให้บริการ http://www.google.co.th/ การสืบค้นแผนที่ด้วย Search Engine ขั้นตอนการสืบค้นแผนที่ด้วย Search Engine 1. ทำการเปิดเว็บไซต์ที่ให้บริการ http://www.google.co.th/ การสืบค้นวีดิโอด้วย Search Engine ขั้นตอนการสืบค้นวีดิโอด้วย Search Engine 1. ทำการเปิดเว็บไซต์ที่ให้บริการ http://www.youtube.com/ การสืบค้นคำศัพท์ด้วย Search Engine 1. ทำการเปิดเว็บไซต์ที่ให้บริการ http://dict.longdo.com ที่มา:http://portal.edu.chula.ac.th/ ปัจจุบันการใช้อินเทอร์เน็ตเข้ามามีบทบาทในชีวิตประจำวันมากขึ้น เพื่อใช้เป็นช่องทางในการติดต่อสื่อสารและแพร่กระจายข่าวสารข้อมูลต่างๆ เมื่อความนิยมในการใช้อินเทอร์เน็ตเป็นไปอย่างแพร่หลาย ทำให้ปริมาณข้อมูลมีมากขึ้นการสืบค้นข้อมูลจึงเป็นเรื่องยากลำบากในการค้นหา จึงมีบริการสืบค้นข้อมูล (Search Engine) เกิดขึ้นเพื่อเข้ามาช่วยในการสืบค้นข้อมูลให้ง่ายสะดวกและรวดเร็วมากยิ่งขึ้น
1. Spider หรือ Web Robot นอกจาก Spider จะทำงานหาลิงค์เพิ่มโดยอัตโนมัติแล้ว Search Engine ส่วนใหญ่อนุญาตให้ส่ง URL เพื่อกำหนดให้ Spider มาทำดัชนีที่เว็บไซต์ใดๆได้ ในปัจจุบันมีบริการที่จะส่ง URL ไป Search Engine หลายๆแห่งพร้อมกันในคราวเดียวเช่นที่ www.submit-it.com Spider หรือ Web Robot จะมีโปรแกรมคำสั่งที่เรียกว่า robots.txt คือการคำสั่งให้ Web Robot ของแต่ละ search engine นั้น ทำตามเก็บ index แต่ละอย่างที่เว็บไซต์ที่อนุญาติ โดยบางเว็บไซต์อาจไม่ต้องการให้ search engine เข้าไปในเว็บบางอย่าง ก็จะเขียนกำหนดได้บน Robot.txt นี้เอง robots.txt เป็น fileที่บอก Search engine ว่า ไม่ต้องมาเก็บเว็บไซต์นี้ หรือเว็บเพจบางหน้า หรือไฟล์บางไฟล์ Robot เป็นโปรแกรมเก็บข้อมูลในอินเตอร์เน็ต ซึ่งบางครั้ง เรียกว่า Spider หรือ ครอว์เลอร์(Crawler) จะทําหน้าที่รวบรวมไฟล์ HTML เพื่อมาเป็นข้อมูล สําหรับสร้างดัชนีค้นหา ให้กับ Search Engine โดยทั่วไปแล้ว โรบอตจะกลับมาที่เว็บไซต์ที่อ่านไปแล้ว เพื่อตรวจสอบ การเปลี่ยนแปลง ตามระยะเวลาที่กําหนด
3. Search Engine software Google ซึ่งเป็น Search Engine ที่ได้รับความนิยมอย่างมากในขณะนี้ มี Spider ที่มีความเร็วในการเก็บข้อมูลโดยที่ความเร็วสูงสุด Spider 4 ตัวสามารถรวบรวมข้อมูลได้มากกว่า 100 เว็บเพจต่อวินาที หรือได้ข้อมูลประมาณ 600 Kต่อวินาที เวลาปรกติประสิทธิภาพของ Spider และ indexer ทำให้ Google ดาวน์โหลดข้อมูลล่าสุด 11 ล้านหน้าในเวลาเพียง 63 ชั่วโมงเฉลี่ยเพียง 4 ล้านหน้าต่อวันหรือ 48.5 หน้าต่อวินาทีเพราะ indexer ทำงานเร็วกว่า Spider จีงมีเวลาพอเพียงเพิ่มประสิทธิภาพการทำ indexer เพื่อให้มันไม่คั่งค้าง ตัวอย่างสถาปัตยกรรม ของ Google ดังรูป รูปที่ 1 High Level Architecture Google
http://www.excite.com/ http://www.altavista.com/ http://www.lycos.com/ 2.Meta Search Engine Meta Search Engine คือ Search Engine ที่ใช้การค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML โดยค้นหาจากฐานข้อมูลของ Search Engine หลาย ๆ แห่ง แล้วแสดงผลลัพธ์ออกมาในมาตรฐานเดียวกัน เพราะ Meta Search Engine ไม่มีฐานข้อมูลของตนเอง จุดเด่นของการค้นหาด้วยวิธีการนี้ คือ สามารถเชื่อมโยงไปยัง Search Engine ประเภทอื่นๆ และยังมีความหลากหลายของข้อมูล จุดด้อยคือ ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บจะใส่ ประโยค หรือถ้อยคำ (Keywords) ต่างๆเข้าไปมากมายเพื่อเวลาใครมาSearch จะได้พบเว็บ หรือ บล็อกของตนเองซึ่งประโยค หรือถ้อยคำต่างๆนั้นอาจไม่ตรงหรือเกี่ยวกับเว็บไซต์นั้นเลยก็ได้ และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลายๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ อาจไม่เที่ยงตรง ตัวอย่าง Meta Search Engine http://www.ixquick.com/ http://www.dogpile.com/ http://www.metacrawler.com/ http://www.mamma.com/ 3 Classified Directory Classified Directory คือสารบัญเว็บไซต์ที่ให้สามารถค้นหาข่าวสารข้อมูล จัดทำโดยมนุษย์ โดยนำข้อมูลที่ปรากฏใน Web ต่างๆ มาจัดเป็นหมวดหมู่ เป็นเรื่องๆ โครงสร้างของการจัดหมวดหมู่จะถูกเตรียมไว้ก่อน ภายใต้แต่ละเรื่องจะทำการแบ่งเป็นเรื่องย่อยๆ ตามลำดับจากเรื่องทั่วไป ไปสู่เรื่องที่มีความเฉพาะเจาะจงมากขึ้น จากนั้นจึงนำเว็บไซต์ต่างๆ ที่รวบรวมมาไปจัดเก็บตามหมวดหมู่ที่จัดทำไว้ ข้อดีของ Classified Directory คือการแบ่งหมวดหมู่ที่ชัดเจนช่วยนำทางในการเข้าถึงข้อมูลจากประเด็นกว้างๆ ที่ยังไม่ชัดเจนไปสู่ประเด็นเรื่องที่ชัดเจนทำให้ในการค้นผู้ใช้ไม่จำเป็นต้องมีความรู้ในเรื่องที่ค้นหรือคำศัพท์เฉพาะในเรื่องที่ค้นมาก่อน ข้อด้อยของ Classified Directory คือขนาดของฐานข้อมูลจะมีขนาดเล็กกว่า Search Engines ทั่วไปเนื่องจาก Classified Directory จัดทำดรรชนีโดยมนุษย์ความรู้ของผู้จัดทำ และผู้ใช้ แตกต่างกันไปปัญหาอาจเกิดจากการจัดทำหมวดหมู่ เช่น - การกำหนดโครงสร้างความสัมพันธ์ของหมวดหมู่ไม่ชัดเจน ไม่สมเหตุสมผล - โครงสร้างหมวดใหญ่ หมวดย่อยมีความซ้ำซ้อน หรือคาบเกี่ยวกัน - เรื่องเดียวกันแต่อยู่ได้หลายที่หลายระดับ อาจสร้างความสับสนให้กับผู้ค้นได้ การเพิ่มชื่อเว็บไซต์เข้าสู่เว็บ Classified Directory ในอดีตการเพิ่มชื่อเว็บไซต์เข้าสู่เว็บ Classified Directory สามารถทำได้ฟรี ไม่มีค่าใช้จ่าย แต่ปัจจุบันมีการทำการตลาดเพื่อให้เว็บไซต์เป็นที่รู้จัก การนำเว็บไซต์เข้าสู่ระบบฐานข้อมูลของ Classified Directory สามารถทำได้ดังนี้ 1. Free Submission คือ Classified Directory ที่ยอมให้เพิ่มชื่อเว็บไซต์เข้าสู่ระบบฐานข้อมูลโดยไม่มีค่าใช้จ่าย 2. Reciprocal Link คือ Classified Directory ที่ต้องทำ Link กลับมาก่อนจึงจะสามารถเพิ่มชื่อเว็บไซต์เข้าสู่ระบบฐานข้อมูลได้ 3. Paid Submissions คือ Classified Directory ที่ต้องจ่ายค่าธรรมเนียมในการเพิ่มชื่อเว็บไซต์เข้าสู่ฐานข้อมูลเว็บไดเรคทอรี่ ตัวอย่าง Classified Directory http://www.dmoz.org/ http://www.galaxy.com/ http://www.yahoo.com/ http://www.sanook.com/ 4. Subject Gateway Subject Gateway คือ Classified Directory จัดทำขึ้นเพื่อใช้ค้นหาข้อมูลในเรื่องใดเรื่องหนึ่งโดยเฉพาะ เช่นกฎหมาย ศาสนา ศิลปะ การศึกษา สุขภาพ มีการแบ่งหมวดและแยกหัวเรื่องโดยบรรณารักษ์ เน้นการรวบรวมทั้งในระดับกว้างและลึกของสาขาวิชาที่รับผิดชอบ ตัวอย่าง Subject Gateway ที่น่าสนใจคือ 1. http://scholar.google.com/ เป็นการร่วมมือกันทั้งจากองค์กรการศึกษา นักวิชาการ และทีมงานด้านเทคนิค เพื่อร่วมกันจัดการกับดัชนีต่างๆ ที่จำเป็นต้องเข้าถึงเนื้อหาข้อมูล รวมถึงการพัฒนาในส่วนของเทคนิคต่าง ๆข้อมูลบางชนิดไม่สามารถจะนำมาเชื่อมโยงได้โดยบริการค้นหาข้อมูลแบบธรรมดา ทำให้ Search Engine ไม่อาจค้นหาข้อมูลเหล่านั้นได้ บริการ Google Scholar มีข้อดีก็คือทำให้ผู้ที่ต้องการค้นหาข้อมูลแบบเฉพาะทางได้พบเจอข้อมูลเหล่านั้นให้ผู้ใช้สามารถค้นหาหรือทางสำเนาดิจิตอลของบทความว่าออนไลน์หรือในห้องสมุดโดยอาจเป็นข้อมูลวิชาการซึ่งปรากฏโดยอ้างอิงจาก'ข้อความเต็มของบทความ,วารสารรายงานทางเทคนิค, วิทยานิพนธ์ หนังสือและเอกสารอื่น ๆ ที่คิดว่าน่าจะเป็นเรื่องที่เกี่ยวข้อง หรือน่าสนใจ 2. http://www.hw.ac.uk/libwww/irn/pinakes/pinakes.html เป็น Subject Gateway เฉพาะที่เรียกตัวเองว่า Multi-Subject Gateways คือรวบรวมเอา Subject Gateway หลายๆที่มารวมที่เว็บไซต์ของตนเอง เห็นได้ว่า Search Engine แต่ละที่มีวิธีการจัดเก็บฐานข้อมูลที่แตกต่างกันไปตามประเภทของ Search Engine ที่นำมาใช้เก็บรวบรวมข้อมูล ดังนั้นการที่จะเข้าไปหาข้อมูลหรือเว็บไซต์ โดยวิธีการ Search เพื่อที่จะให้ได้ข้อมูลตรงกับวัตถุประสงค์และความต้องการมากที่สุดจะต้องทราบว่า เว็บไซต์ที่เข้าไปใช้บริการ ใช้วิธีการหรือ ประเภทของ Search Engine อะไร เนื่องจากแต่ละประเภทมีความละเอียดในการจัดเก็บข้อมูลต่างกันไป ในปัจจุบัน Search Engine มีอยู่มากมายแต่ได้รับความนิยมอยู่ไม่กี่เว็บไซต์โดย www.google.com มีผู้มาใช้มากที่สุด ประมาณ 70%และเมื่อนำ www.google.com , search.yahoo.com , www.bing.com มารวมกันจะได้ส่วนแบ่งตลาดไปเกือบทั้งหมดคือประมาณ 90% ดูได้จากตารางต่อไปนี้ Top Search Engine - Volume The following report shows search engines for the industry 'All Categories', ranked by Volume of Searches for the 4 weeks ending21/08/2010. Top Search Engines – Visits The following report shows websites for the industry 'Computers and Internet - Search Engines', ranked by Visits for the week ending21/08/2010.
Meta tags ที่จะแทรกนั้นจะมี 2 อย่างคือ 1.Description เป็นส่วนที่ใช้บอกรายละเอียดของเว็บเพจแบบคร่าวๆ 2.Keywords เป็นส่วนที่ใช้บอก คำที่เกี่ยวข้องกับเว็บเพจหน้านี้ เป็นคำที่ใช้ในการค้นหาหน้านี้
1.เปิดหน้าเว็บเพจที่เราต้องการแทรก Meta tags ขึ้นมา 2.ไปที่ Menu เลือก Insert > HTML > Head Tags > Description 3.จะมีกล่องข้อความขี้นมาให้เขียนรายละเอียดลงไปในกล่องนั้น ใส่ได้เฉพาะตัวอักษรห้ามใส่ Code ต่างๆ จะ เป็นภาษาอังกฤษ หรือไทยก็ได้ |