Welkom, Gast. Je bent niet ingelogd.

Zoekmachine maken

Bart
Hoeren :'(
Geplaatst op: 26 Jan 2008, 12:40
PimpCoins: 0
💸+
Bewerken Quote

Heey, ik heb weer een vraagie . Ik wou graag een zoekmachine maken, net zoals google zeg maar. Dan kunnen mensen hun link aanmelden etc etc. Mijn vraag was of hier een bepaalde source voor is ? (liefst gratis maarr.. ) Ik heb al flink gegoogled, maar dan krijg ik alleen maar pagina's, van zoekmachines die in je eigen site of google zoeken. Hopelijk weten jullie nu wat ik ongeveer bedoel .

Alvast bedankt,
Gommy

tttommeke
Geplaatst op: 26 Jan 2008, 12:45
PimpCoins: 0
💸+
Bewerken Quote

Nou, het scripten hiervan is niet al te moeilijk. Ik zou ook aanraden om op wmcity.nl naar een artikel te kijken hoe je het best een query laat zoeken etc.

Melvin
Geplaatst op: 26 Jan 2008, 12:47
PimpCoins: 0
💸+
Bewerken Quote

tttommeke schreef:

Nou, het scripten hiervan is niet al te moeilijk. Ik zou ook aanraden om op wmcity.nl naar een artikel te kijken hoe je het best een query laat zoeken etc.

Wmcity.nl is toch niet zo super die zoekmachines maakt?

Bart
Hoeren :'(
Geplaatst op: 26 Jan 2008, 12:48
PimpCoins: 0
💸+
Bewerken Quote

Ah, maar heb je ook al bepaalde sources ?

tttommeke
Geplaatst op: 26 Jan 2008, 12:49
PimpCoins: 0
💸+
Bewerken Quote

http://wmcity.nl/artikelen.php?actie=bekijk&id=494 <= Ik bedoel het artikel om snel dingen te zoeken uit je database

Bart
Hoeren :'(
Geplaatst op: 26 Jan 2008, 12:53
PimpCoins: 0
💸+
Bewerken Quote

tttommeke schreef:

http://wmcity.nl/artikelen.php?actie=bekijk&id=494 <= Ik bedoel het artikel om snel dingen te zoeken uit je database

Dat lijkt toch niet eens op een soort zoekmachine zoals google?

tttommeke
Geplaatst op: 26 Jan 2008, 12:55
PimpCoins: 0
💸+
Bewerken Quote

... Je kan dit doen :

1 pagina => search.php die uit de database leest
1 pagina => toevoegen.php die websites toevoegt
1 pagina => admin.php waar je de urls kunt accepteren

Sharp
:')
moderator
Geplaatst op: 26 Jan 2008, 13:31
PimpCoins: 0
💸+
Bewerken Quote

Lennard schreef:

[...]
Om alles te indexeren kun je beter een stand-alone programma maken, en geen webbased iets; werkt sneller...

Allereerst moet je een goeie snelle verbinding hebben, een hele zooi PC's (google heeft er een half miljoen dacht ik ), en een zooi personen die een zooi algoritmes kunnen bedenken en uitwerken (wie komt er als eerste op de lijst, welke tekst sla je op in je database, hóe sla je het op, enzovoort), een geldschieter (iemand die echt héééél veel geld over heeft ).

Maar waarom wil je dit? Je zult toch nooit een goede concurrent worden van Google of live.nl als je niet zelf alles probeert uit te vinden.

Nu even m'n theorieverhaal.
Volgens een site (heb even gegoogled ) waren er in augustus 2005 zo'n 70.000.000 websites.
Zeg dat elke site 14 pagina's kent, heb je precies 1 miljard paginas.

Zeg dat een gemiddelde website 10.000 tekens bevat (de pagina om op een topic te reageren hier op saven.nl heeft er +/- 25.000), dan heb je dus 10.000 miljard tekens die je wilt opslaan.
10.000.000.000.000 byte
10.000.000.000 megabyte
10.000.000 gigabyte
10.000 terabyte
10 petabyte

Op 4launch.nl vond ik een hdd met 160 gig voor &#8364; 50,-
Je moet 10.000.000 / 160 = 62.500 schijven hebben, maal &#8364; 50,- komt neer op &#8364; 3.125.000,- voor alléén de hardeschijven voor alle data.

Dan moet je nog pc's hebben (zeg dat er maximaal 10 hdd's in 1 pc kunnen, dan heb je 6.250 pc's nodig, maal 200 euro = &#8364; 1.250.000,= is tot nu toe &#8364; 4.375.000,-).
Dan moet je nog een snelle internetverbinding hebben voor iedere pc, een firewall, een datacenter, verzekeringen, en verder nog servers voor de userinterface van de zoekmachine (waar je je zoekopdracht invoert), dus dat kost je een hoop poen.


Christan
Pwn erd
Geplaatst op: 26 Jan 2008, 14:26
PimpCoins: 0
💸+
Bewerken Quote

Zoals al in de quote staat is het niet te doen om het helemaal zelf te maken.
Als je een scriptje maakt dan zal die gebruik maken van google oid. dus je moet alles zelf indexeren en dat is niet te doen (voor een normaal persoon)

Bart
Hoeren :'(
Geplaatst op: 26 Jan 2008, 14:37
PimpCoins: 0
💸+
Bewerken Quote

Sharp schreef:

[...]

Oke, dat overtuigt wel .

Nee dan weet ik dat .
Kan je eigelijk ook geen zoekmachine site maken, die ook in de pagina's van google en yahoo etc zoekt?

Sharp
:')
moderator
Geplaatst op: 26 Jan 2008, 14:57
PimpCoins: 0
💸+
Bewerken Quote

Er was een keer een zoek site die alle eerst 5 hits van Google, Altavista, Yahoo en nog een paar onder elkaar zette Limoune.nl ofzo.
* Zoekt op *
Oh dat domein is dus gekaapt ().
[url]http://web.archive.org/web/20070127122313/http://www.limoune.nl/[/url]
[url]http://web.archive.org/web/20060615185342/http://www.limoune.nl/[/url]

Ik dacht trouwens dat die site van ene Wouter was

Bart
Hoeren :'(
Geplaatst op: 26 Jan 2008, 15:10
PimpCoins: 0
💸+
Bewerken Quote

Sharp schreef:

Er was een keer een zoek site die alle eerst 5 hits van Google, Altavista, Yahoo en nog een paar onder elkaar zette Limoune.nl ofzo.
* Zoekt op *
Oh dat domein is dus gekaapt ().
[url]http://web.archive.org/web/20070127122313/http://www.limoune.nl/[/url]
[url]http://web.archive.org/web/20060615185342/http://www.limoune.nl/[/url]

Ik dacht trouwens dat die site van ene Wouter was

Ja dat is het .

Maarja, dan moet je nog de code hebben hea

Sharp
:')
moderator
Geplaatst op: 26 Jan 2008, 15:11
PimpCoins: 0
💸+
Bewerken Quote

Kan je wel zelf maken opzich . Zijn genoeg functies in php waarmee je data kan opvragen e.d en ook van zoeksites links kan halen.

Misschien dat je met reguliere expressies kan gaan werken.

[Laatst bewerkt door Sharp op zaterdag 26 januari 2008, om 15:15]
Guz
Housejunkie
moderator
Geplaatst op: 26 Jan 2008, 16:32
PimpCoins: 0
💸+
Bewerken Quote

Een nutteloos project, hoeveel mensen melden een link aan? Hoeveel artikelen zijn er wel niet over de hele wereld? Ook al zijn er 10.000 toegevoegde pagina's je vind nog steeds bijna niets.

Google neemt bijvoorbeeld Saven.nl en alle links die hij tegenkomt indexeerd hij, dus als ik een pagina online plaats waar niemand iets vanaf weet zal deze ook niet geindexeerd worden.

Heeft vrij weinig zin lijkt me

Maar als je het echt wilt doen.. Heb je een database nodig en dan een script dat in de database zoekt naar bepaalde trefwoorden. Maar als jij er ook nog uitleg bij wilt zul je gauw vol zitten met je hosting accountje..

Bart
Hoeren :'(
Geplaatst op: 26 Jan 2008, 16:49
PimpCoins: 0
💸+
Bewerken Quote

Guz schreef:

Een nutteloos project, hoeveel mensen melden een link aan? Hoeveel artikelen zijn er wel niet over de hele wereld? Ook al zijn er 10.000 toegevoegde pagina's je vind nog steeds bijna niets.

Google neemt bijvoorbeeld Saven.nl en alle links die hij tegenkomt indexeerd hij, dus als ik een pagina online plaats waar niemand iets vanaf weet zal deze ook niet geindexeerd worden.

Heeft vrij weinig zin lijkt me

Maar als je het echt wilt doen.. Heb je een database nodig en dan een script dat in de database zoekt naar bepaalde trefwoorden. Maar als jij er ook nog uitleg bij wilt zul je gauw vol zitten met je hosting accountje..

Ja heb je gelijk in. Dan ga ik er toch maar niet mee door. Bedankt voor alle info dan weet ik dit ook weer

Joris
moderator
Geplaatst op: 02 Feb 2008, 19:02
PimpCoins: 0
💸+
Bewerken Quote

Je kan een script downloaden en die configureren met je Google-Api key (kun je aanvragen)... Dan werkt je zoekmachine op Google...

Jaapje
Geplaatst op: 02 Feb 2008, 19:35
PimpCoins: 0
💸+
Bewerken Quote

Joris schreef:

Je kan een script downloaden en die configureren met je Google-Api key (kun je aanvragen)... Dan werkt je zoekmachine op Google...

Wat is daar het nut van? Als ik iets op wil zoeken ga ik wel naaar google zelf.

Joris
moderator
Geplaatst op: 11 Feb 2008, 19:16
PimpCoins: 0
💸+
Bewerken Quote

Jaapje schreef:

[...]
Wat is daar het nut van? Als ik iets op wil zoeken ga ik wel naaar google zelf.

0mg lees dan waar dit topic over gaat... iemand hier wil een zoekmachine starten... en diegene wil niet weten hoe je iets op moet zoeken met google ofzo

Saven
admin
Geplaatst op: 11 Feb 2008, 19:43
PimpCoins: 0
💸+
Bewerken Quote

Web based crawler moet je niet aan beginnen, daar is o.a. php niet echt voor bedoeld.
Je moet een eigen crawler programmeren, die website content afspeurt en indexeert (opslaat).
De crawler maken is nog het makkelijkste deel, zorg daarna maar eens dat je genoeg ruimte hebt voor heeeel het internet

[video=I7w_y68cxy0]
die plaat pwned

📫

Nieuw privébericht

🔥

Registreren


Login