fossasia · bhaveshAn · Jan 26, 2018 · Jan 22, 2018 · Jan 23, 2018 · Jan 23, 2018
diff --git a/app/scrapers/__init__.py b/app/scrapers/__init__.py
@@ -46,6 +46,8 @@ def feed_gen(query, engine, count=10, qtype=''):
         urls = scrapers[engine].video_search_without_count(query)
     elif engine in ('bing',) and qtype == 'isch':
         urls = scrapers[engine].image_search_without_count(query)
+    elif engine in ('ask',) and qtype == 'vid':
+        urls = scrapers[engine].video_search(query, count, qtype)
     else:
         urls = scrapers[engine].search(query, count, qtype)
     return urls
diff --git a/app/scrapers/ask.py b/app/scrapers/ask.py
@@ -7,6 +7,7 @@ class Ask(Scraper):
     def __init__(self):
         Scraper.__init__(self)
         self.url = 'http://ask.com/web'
+        self.videoURL = 'https://www.ask.com/youtube'
         self.defaultStart = 1
         self.startKey = 'page'
         self.name = 'ask'
@@ -35,3 +36,25 @@ def parse_response(soup):
                 urls.append({'title': title, 'link': url})
         print('Ask parsed: ' + str(urls))
         return urls
+
+    @staticmethod
+    def parse_video_response(soup):
+        """ Parse response and returns the urls
+
+            Returns: urls (list)
+                    [[Tile1, url1], [Title2, url2], ...]
+        """
+        urls = []
+        for div in soup.findAll('div', attrs={'class': 'v-info'}):
+            title = div.div.find('a').getText()
+            url = 'https' + div.div.a.get('href')
+            desc = div.find('div', attrs={'class': 'desc'}).getText()
+            urls.append({
+                'title': title,
+                'link': url,
+                'desc': desc
+            })
+
+        print('Ask parsed: ' + str(urls))
+
+        return urls
diff --git a/app/scrapers/generalized.py b/app/scrapers/generalized.py
@@ -29,6 +29,13 @@ def get_page(self, query, startIndex=0, qtype=''):
         if qtype == 'vid':
             if self.name in ['yahoo']:
                 url = self.videoURL
+            elif self.name in ['ask']:
+                url = self.videoURL
+                payload = {self.queryKey: query, self.startKey: startIndex}
+                response = requests.get(
+                    url, headers=self.headers, params=payload
+                )
+                return response
             else:
                 url = self.url
         payload = {self.queryKey: query, self.startKey: startIndex,
@@ -85,6 +92,26 @@ def search_without_count(self, query):
         urls = self.parse_response(soup)
         return urls
 
+    def video_search(self, query, num_results, qtype=''):
+        urls = []
+        current_start = self.defaultStart
+
+        while (len(urls) < num_results):
+            response = self.get_page(query, current_start, qtype)
+            soup = BeautifulSoup(response.text, 'html.parser')
+            if qtype == 'vid':
+                if self.name in ['yahoo', 'ask']:
+                    new_results = self.parse_video_response(soup)
+                else:
+                    new_results = self.parse_response(soup)
+            else:
+                new_results = self.parse_response(soup)
+            if new_results is None:
+                break
+            urls.extend(new_results)
+            current_start = self.next_start(current_start, new_results)
+        return urls[: num_results]
+
     def video_search_without_count(self, query):
         """
             Search for the query and return set of urls

diff --git a/test/test_ask.py b/test/test_ask.py
@@ -56,3 +56,21 @@ def test_parse_response_without_desc():
         }
     ]
     assert resp == expected_resp
+
+
+def test_parse_video_response():
+    html_div = """<div class="v-info"><div class="v-title">
+                  <a class="title" href="mock_url">mock_title</a></div>
+                  <div class="desc">mock_desc</div>
+                  </div>"""
+    stub_soup_div = BeautifulSoup(html_div, 'html.parser')
+    resp = Ask().parse_video_response(stub_soup_div)
+    url_video = 'https' + 'mock_url'
+    expected_resp = [
+        {
+            'link': url_video,
+            'title': u'mock_title',
+            'desc': u'mock_desc'
+        }
+    ]
+    assert resp == expected_resp