Bạn đừng vội nản lòng vì một số công cụ chỉ lướt trên bề mặt của web, vì vậy kết quả tìm kiếm không thể liệt kê được những gì thuộc về “phần chìm” của Web. Nếu bạn cần tìm những thông tin mang tính đặc thù, chẳng hạn như số liệu thống kê dân số hoặc danh sách các bằng phát minh, các công cụ tìm kiếm thông thường chỉ dẫn dắt bạn thới các website có thể có thông tin mà bạn cần và sau đó bạn phải dụng công cụ tìm kiếm của chính các website đó để có được thông tin. Nói một cách đơn giản, các website tìm kiếm chỉ dẫn bạn đến cửa của một thư viện nhưng không chỉ ra cho bạn cuốn sách mà bạn cần, việc tiếp theo là bạn phải tìm trong chính thư viện đó để có được thông tin.
Muốn tìm kiếm được những thông tin ở “phần chìm”, phải sử dụng các công cụ tìm kiếm khác với công cụ tìm kiếm thông thường. Theo công ty Bright Plannet, “phần chìm” của Web có khoảng 550 tỷ trang tài liệu, trong khi dó Web bề mặt chỉ chứa khoảng 1 tỷ trang. “Phần chìm” của Web chứa các tài liệu mà các công cụ tìm kiếm thông thường hay bỏ qua như các tệp PDF, các tệp âm thanh và hình ảnh (audio và video), các thông tin được lưu trong cơ sở dữ liệu như các số liệu thống kê của chính phủ hoặc danh bạ điện thoại.
Để tìm kiếm các thông tin thuộc phần chìm của Web, có thể tới một trong các địa chỉ sau:
Direct Search
http://gwis2.circ.gwu.edu/%7egprice/direct.htm
InvisibleWeb.com
http://www.invisibleweb.com
InforMine
http://infomine.ucr.edu/search.phtml
CompletePlanet
http://www.completeplanet.com
WebData.com
http://www.webdata.com
Lycos Searchable Databases
http://dir.lycos.com/reference/searchable_databases
ProFusion.com
http://beta.profusion.com
Bạn nhớ lưu ý rằng những công cụ tìm kiếm này thường khó sử dụng hơn các công cụ tìm kiếm thông thường. Nó rất thích hợp với những nhà nghiên cứu muốn tìm kiếm thông tin chuyên sâu nhưng lại gây khó khăn đối với những người mới sử dụng. Bạn cần phải đọc kỹ các hướng dẫn tìm kiếm tại các công cụ này để giới hạn các thông tin cần tìm càng hẹp càng tốt, nếu không bạn có thể sẽ phải nhận kết quả trả về là một danh sách dài tới vài triệu trang.