Страницы: 1
RSS
Выделение из исходного текста поиска Google, если в результате поиска есть ссылка на ru.wikipedia.org
 
Добрый день.
Есть у меня перечень футболистов (примерно 2,5 тыс строк). Их имена и фамилии на иностранном языке (англ., франц.).
Хочу получить их соответствие на русском. Перевести через Google не получилось (очень много ошибок)

Решил их имена и фамилии с wikipedia брать. Для этого генерирую поиск в Google по тем данным, что у меня есть, и выбираю из ссылки на wikipedia ФИО.
Но не вышло. Не пойму почему в responseText нет нужного мне фрагмента, хотя если в браузере посмотреть исходный код, то нужный фрагмент есть.

Мои попытки во вложении и под спойлером.
Скрытый текст
 
1. Полагаю, это из-за того, что на гугле (да и на яндексе) ссылки не прямые на источник, а через их внутреннюю систему аналитики + формат urlencode:
Код
https://www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=0ahUKEwiH1OilxO7QAhXEWCwKHQ5dDQ0QFggaMAA&url=https%3A%2F%2Fru.wikipedia.org%2Fwiki%2F%25D0%259A%25D0%25B0%25D0%25BC%25D0%25B5%25D0%25BD%25D0%25B8%2C_%25D0%259A%25D0%25B0%25D1%2580%25D0%25BB%25D0%25BE%25D1%2581&usg=AFQjCNErBafn2fe1qncWF2O5xiOoRTwDbQ&sig2=y4rNAfuqoHndpLepZ4yyqw&cad=rja
2. А что бы вам напрямую в википедии не искать? https://ru.wikipedia.org/w/index.php?search=Carlos+Kameni&title=%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1...
 
Цитата
zamboga написал: ссылки не прямые на источник
не спорю, но в исходном коде через браузер я же это могу увидеть ...
Вопрос скорее всего актуальность утратил, т.к. по малоизвестным товарищам такой подход не подойдет, а их там половина ...
Страницы: 1
Наверх