联创众升大数据面试题

联创众升大数据面试题
联创众升大数据面试题文章插图
算法工程师面试题
1.请列出几种文本特征提取算法 。
2.简述几种自然语言处理开源工具包 。
【联创众升大数据面试题】3.请简述几种熟悉的分类算法 。
4.请简单描述一下深度学习?主要应用范围?常见工具有哪些?
5.说明一下利用HMM实现实体识别的过程?
6.请简述文本数据结构化表示涉及技术方法 。
7.如何构建一个简单的领域知识图谱 。
8.以下代码是Java实现中文分词 , 请简述分词过程 。
public class SplitChineseCharacter {public static void main(String[] args) {String input = "太好了 , 今天是星期六啊";new Split(input).start();}} class Split {private String[] dictionary = { "今天", "是", "星期", "星期六" };private String input = null;public Split(String input) {this.input = input;}public void start() {String temp = null;for (int i = 0; i < this.input.length(); i++) {temp = this.input.substring(i);if (this.isInDictionary(temp)) {System.out.println(temp);this.input = this.input.replaceAll(temp, "");i = -1;}}if (null != this.inputthis.start();}}public boolean isInDictionary(String temp) {for (int i = 0; i < this.dictionary.length; i++) {if (temp.equals(this.dictionary[i])) {return true;}}return false;}}