Verfügbarkeit: Modern Big Data Processing with Hadoop :

Modern Big Data Processing with Hadoop :: Expert techniques for architecting end-to-end big data solutions to get valuable insights /

This book presents unique techniques to conquer different Big Data processing and analytics challenges using Hadoop. Practical examples are provided to boost your understanding of Big Data concepts and their implementation. By the end of the book, you will have all the knowledge and skills you need...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Kumar, V. Naresh (VerfasserIn), Shindgikar, Prashant (VerfasserIn)
Format:	Elektronisch E-Book
Sprache:	English
Veröffentlicht:	Birmingham : Packt Publishing, 2018.
Schlagworte:	Apache Hadoop. Apache Hadoop Electronic data processing > Distributed processing. Traitement réparti. Database design & theory. Data mining. Information architecture. Data capture & analysis. Computers > Database Management > Data Mining. Computers > Data Modeling & Design. Computers > Data Processing. COMPUTERS > Computer Literacy. COMPUTERS > Computer Science. COMPUTERS > Hardware > General. COMPUTERS > Information Technology. COMPUTERS > Machine Theory. COMPUTERS > Reference. Data Processing. COMPUTERS. Data Mining. Databases. Data Modeling & Design. Electronic data processing > Distributed processing Electronic books.
Online-Zugang:	DE-862 DE-863
Zusammenfassung:	This book presents unique techniques to conquer different Big Data processing and analytics challenges using Hadoop. Practical examples are provided to boost your understanding of Big Data concepts and their implementation. By the end of the book, you will have all the knowledge and skills you need to become a true Big Data expert.
Beschreibung:	Table of ContentsHadoop Design Consideration Hadoop Life Cycle ManagementData Modeling in HadoopDesigning Streaming Data PipelinesBuilding Enterprise Search Platform Data Movement TechniquesEnterprise Data Architecture PrinciplesArchitecting Large Scale Data Processing Solutions using Spark Developing Application using Cloud InfrastructureDesigning Data Visualization Solutions Production Hadoop Administration and Cluster Deployment.
Beschreibung:	1 online resource (394 pages)
Bibliographie:	Includes bibliographical references.
ISBN:	9781787128811 1787128814 178712276X 9781787122765

Internformat

MARC


LEADER	00000cam a2200000 i 4500
001	ZDB-4-EBA-on1032152617
003	OCoLC
005	20250103110447.0
006	m o d
007	cr \|\|\|\|\|\|\|\|\|\|\|
008	180412s2018 enk go 000 0 eng d
040			\|a NLE \|b eng \|e pn \|c NLE \|d NLE \|d EBLCP \|d MERUC \|d IDB \|d CHVBK \|d OCLCO \|d OCLCF \|d VT2 \|d OCLCQ \|d OCLCO \|d TEFOD \|d OCLCQ \|d N$T \|d LVT \|d C6I \|d UKAHL \|d OCLCQ \|d OCLCO \|d UKMGB \|d OCLCO \|d OCLCQ \|d OCLCO \|d OCLCL \|d TMA \|d OCLCQ \|d CLOUD
015			\|a GBC200204 \|2 bnb
016	7		\|a 018835881 \|2 Uk
019			\|a 1031344421 \|a 1295106151
020			\|a 9781787128811 \|q (electronic bk.)
020			\|a 1787128814 \|q (electronic bk.)
020			\|a 178712276X
020			\|a 9781787122765
020			\|z 178712276X
020			\|z 9781787122765
024	3		\|a 9781787122765
035			\|a (OCoLC)1032152617 \|z (OCoLC)1031344421 \|z (OCoLC)1295106151
037			\|a 9781787128811 \|b Packt Publishing
037			\|a D508DE65-BBBA-46CD-928A-49C8DFBFE6AC \|b OverDrive, Inc. \|n http://www.overdrive.com
050		4	\|a QA76.9.D5 \|b .K863 2018eb
072		7	\|a COM \|x 013000 \|2 bisacsh
072		7	\|a COM \|x 014000 \|2 bisacsh
072		7	\|a COM \|x 018000 \|2 bisacsh
072		7	\|a COM \|x 067000 \|2 bisacsh
072		7	\|a COM \|x 032000 \|2 bisacsh
072		7	\|a COM \|x 037000 \|2 bisacsh
072		7	\|a COM \|x 052000 \|2 bisacsh
082	7		\|a 004.36 \|2 23
049			\|a MAIN
100	1		\|a Kumar, V. Naresh, \|e author.
245	1	0	\|a Modern Big Data Processing with Hadoop : \|b Expert techniques for architecting end-to-end big data solutions to get valuable insights / \|c V Naresh Kumar, Prashant Shindgikar.
264		1	\|a Birmingham : \|b Packt Publishing, \|c 2018.
300			\|a 1 online resource (394 pages)
336			\|a text \|b txt \|2 rdacontent
337			\|a computer \|b c \|2 rdamedia
338			\|a online resource \|b cr \|2 rdacarrier
500			\|a Table of ContentsHadoop Design Consideration Hadoop Life Cycle ManagementData Modeling in HadoopDesigning Streaming Data PipelinesBuilding Enterprise Search Platform Data Movement TechniquesEnterprise Data Architecture PrinciplesArchitecting Large Scale Data Processing Solutions using Spark Developing Application using Cloud InfrastructureDesigning Data Visualization Solutions Production Hadoop Administration and Cluster Deployment.
505	0		\|a Cover; Title Page; Copyright and Credits; Packt Upsell; Contributors; Table of Contents; Preface; Chapter 1: Enterprise Data Architecture Principles; Data architecture principles; Volume; Velocity; Variety; Veracity; The importance of metadata; Data governance; Fundamentals of data governance; Data security; Application security; Input data; Big data security; RDBMS security; BI security; Physical security; Data encryption; Secure key management; Data as a Service; Evolution data architecture with Hadoop; Hierarchical database architecture; Network database architecture.
505	8		\|a Relational database architectureEmployees; Devices; Department; Department and employee mapping table; Hadoop data architecture; Data layer; Data management layer; Job execution layer; Summary; Chapter 2: Hadoop Life Cycle Management; Data wrangling; Data acquisition; Data structure analysis; Information extraction; Unwanted data removal; Data transformation; Data standardization; Data masking; Substitution; Static ; Dynamic; Encryption; Hashing; Hiding; Erasing; Truncation; Variance; Shuffling; Data security; What is Apache Ranger?; Apache Ranger installation using Ambari; Ambari admin UI.
505	8		\|a Add serviceService placement; Service client placement; Database creation on master; Ranger database configuration; Configuration changes; Configuration review; Deployment progress; Application restart; Apache Ranger user guide; Login to UI; Access manager; Service details; Policy definition and auditing for HDFS; Summary; Chapter 3: Hadoop Design Consideration; Understanding data structure principles; Installing Hadoop cluster; Configuring Hadoop on NameNode; Format NameNode; Start all services; Exploring HDFS architecture; Defining NameNode; Secondary NameNode; NameNode safe mode; DataNode.
505	8		\|a Data replicationRack awareness; HDFS WebUI; Introducing YARN; YARN architecture; Resource manager; Node manager; Configuration of YARN; Configuring HDFS high availability; During Hadoop 1.x; During Hadoop 2.x and onwards; HDFS HA cluster using NFS; Important architecture points; Configuration of HA NameNodes with shared storage; HDFS HA cluster using the quorum journal manager; Important architecture points; Configuration of HA NameNodes with QJM; Automatic failover; Important architecture points; Configuring automatic failover; Hadoop cluster composition; Typical Hadoop cluster.
505	8		\|a Best practices Hadoop deploymentHadoop file formats; Text/CSV file; JSON; Sequence file; Avro; Parquet; ORC; Which file format is better?; Summary; Chapter 4: Data Movement Techniques; Batch processing versus real-time processing; Batch processing; Real-time processing; Apache Sqoop; Sqoop Import; Import into HDFS; Import a MySQL table into an HBase table; Sqoop export; Flume; Apache Flume architecture; Data flow using Flume; Flume complex data flow architecture; Flume setup; Log aggregation use case; Apache NiFi; Main concepts of Apache NiFi; Apache NiFi architecture; Key features.
520			\|a This book presents unique techniques to conquer different Big Data processing and analytics challenges using Hadoop. Practical examples are provided to boost your understanding of Big Data concepts and their implementation. By the end of the book, you will have all the knowledge and skills you need to become a true Big Data expert.
504			\|a Includes bibliographical references.
630	0	0	\|a Apache Hadoop. \|0 http://id.loc.gov/authorities/names/n2013024279
630	0	7	\|a Apache Hadoop \|2 fast
650		0	\|a Electronic data processing \|x Distributed processing. \|0 http://id.loc.gov/authorities/subjects/sh85042293
650		6	\|a Traitement réparti.
650		7	\|a Database design & theory. \|2 bicssc
650		7	\|a Data mining. \|2 bicssc
650		7	\|a Information architecture. \|2 bicssc
650		7	\|a Data capture & analysis. \|2 bicssc
650		7	\|a Computers \|x Database Management \|x Data Mining. \|2 bisacsh
650		7	\|a Computers \|x Data Modeling & Design. \|2 bisacsh
650		7	\|a Computers \|x Data Processing. \|2 bisacsh
650		7	\|a COMPUTERS \|x Computer Literacy. \|2 bisacsh
650		7	\|a COMPUTERS \|x Computer Science. \|2 bisacsh
650		7	\|a COMPUTERS \|x Hardware \|x General. \|2 bisacsh
650		7	\|a COMPUTERS \|x Information Technology. \|2 bisacsh
650		7	\|a COMPUTERS \|x Machine Theory. \|2 bisacsh
650		7	\|a COMPUTERS \|x Reference. \|2 bisacsh
650		7	\|a Data Processing. \|2 bisacsh/2013
650		7	\|a COMPUTERS. \|2 bisacsh/2013
650		7	\|a Data Mining. \|2 bisacsh/2013
650		7	\|a Databases. \|2 bisacsh/2013
650		7	\|a Data Modeling & Design. \|2 bisacsh/2013
650		7	\|a Electronic data processing \|x Distributed processing \|2 fast
655		0	\|a Electronic books.
700	1		\|a Shindgikar, Prashant, \|e author.
758			\|i has work: \|a Modern big data processing with Hadoop (Text) \|1 https://id.oclc.org/worldcat/entity/E39PCYVtfqwyTgQvFtBVQWhbVC \|4 https://id.oclc.org/worldcat/ontology/hasWork
776	0	8	\|i Print version: \|a Kumar, V Naresh. \|t Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights. \|d Birmingham : Packt Publishing, ©2018
966	4	0	\|l DE-862 \|p ZDB-4-EBA \|q FWS_PDA_EBA \|u https://search.ebscohost.com/login.aspx?direct=true&scope=site&db=nlebk&AN=1789468 \|3 Volltext
966	4	0	\|l DE-863 \|p ZDB-4-EBA \|q FWS_PDA_EBA \|u https://search.ebscohost.com/login.aspx?direct=true&scope=site&db=nlebk&AN=1789468 \|3 Volltext
884			\|a LDL ebooks ONIX to marcxml transformation using Record_Load-eBooks_Legal_Deposit_onix2marc_v2-1.xsl \|g 20180412 \|k 9781787128811 \|q Uk.
936			\|a BATCHLOAD
938			\|a cloudLibrary \|b CLDL \|n 9781787128811
938			\|a Askews and Holts Library Services \|b ASKH \|n AH34229802
938			\|a EBL - Ebook Library \|b EBLB \|n EBL5340524
938			\|a EBSCOhost \|b EBSC \|n 1789468
994			\|a 92 \|b GEBAY
912			\|a ZDB-4-EBA
049			\|a DE-862
049			\|a DE-863

Datensatz im Suchindex

DE-BY-FWS_katkey	ZDB-4-EBA-on1032152617
_version_	1829095136468926464
adam_text
any_adam_object
author	Kumar, V. Naresh Shindgikar, Prashant
author_facet	Kumar, V. Naresh Shindgikar, Prashant
author_role	aut aut
author_sort	Kumar, V. Naresh
author_variant	v n k vn vnk p s ps
building	Verbundindex
bvnumber	localFWS
callnumber-first	Q - Science
callnumber-label	QA76
callnumber-raw	QA76.9.D5 .K863 2018eb
callnumber-search	QA76.9.D5 .K863 2018eb
callnumber-sort	QA 276.9 D5 K863 42018EB
callnumber-subject	QA - Mathematics
collection	ZDB-4-EBA
contents	Cover; Title Page; Copyright and Credits; Packt Upsell; Contributors; Table of Contents; Preface; Chapter 1: Enterprise Data Architecture Principles; Data architecture principles; Volume; Velocity; Variety; Veracity; The importance of metadata; Data governance; Fundamentals of data governance; Data security; Application security; Input data; Big data security; RDBMS security; BI security; Physical security; Data encryption; Secure key management; Data as a Service; Evolution data architecture with Hadoop; Hierarchical database architecture; Network database architecture. Relational database architectureEmployees; Devices; Department; Department and employee mapping table; Hadoop data architecture; Data layer; Data management layer; Job execution layer; Summary; Chapter 2: Hadoop Life Cycle Management; Data wrangling; Data acquisition; Data structure analysis; Information extraction; Unwanted data removal; Data transformation; Data standardization; Data masking; Substitution; Static ; Dynamic; Encryption; Hashing; Hiding; Erasing; Truncation; Variance; Shuffling; Data security; What is Apache Ranger?; Apache Ranger installation using Ambari; Ambari admin UI. Add serviceService placement; Service client placement; Database creation on master; Ranger database configuration; Configuration changes; Configuration review; Deployment progress; Application restart; Apache Ranger user guide; Login to UI; Access manager; Service details; Policy definition and auditing for HDFS; Summary; Chapter 3: Hadoop Design Consideration; Understanding data structure principles; Installing Hadoop cluster; Configuring Hadoop on NameNode; Format NameNode; Start all services; Exploring HDFS architecture; Defining NameNode; Secondary NameNode; NameNode safe mode; DataNode. Data replicationRack awareness; HDFS WebUI; Introducing YARN; YARN architecture; Resource manager; Node manager; Configuration of YARN; Configuring HDFS high availability; During Hadoop 1.x; During Hadoop 2.x and onwards; HDFS HA cluster using NFS; Important architecture points; Configuration of HA NameNodes with shared storage; HDFS HA cluster using the quorum journal manager; Important architecture points; Configuration of HA NameNodes with QJM; Automatic failover; Important architecture points; Configuring automatic failover; Hadoop cluster composition; Typical Hadoop cluster. Best practices Hadoop deploymentHadoop file formats; Text/CSV file; JSON; Sequence file; Avro; Parquet; ORC; Which file format is better?; Summary; Chapter 4: Data Movement Techniques; Batch processing versus real-time processing; Batch processing; Real-time processing; Apache Sqoop; Sqoop Import; Import into HDFS; Import a MySQL table into an HBase table; Sqoop export; Flume; Apache Flume architecture; Data flow using Flume; Flume complex data flow architecture; Flume setup; Log aggregation use case; Apache NiFi; Main concepts of Apache NiFi; Apache NiFi architecture; Key features.
ctrlnum	(OCoLC)1032152617
dewey-full	004.36
dewey-hundreds	000 - Computer science, information, general works
dewey-ones	004 - Computer science
dewey-raw	004.36
dewey-search	004.36
dewey-sort	14.36
dewey-tens	000 - Computer science, information, general works
discipline	Informatik
format	Electronic eBook
fullrecord	<?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>07916cam a2200985 i 4500</leader><controlfield tag="001">ZDB-4-EBA-on1032152617</controlfield><controlfield tag="003">OCoLC</controlfield><controlfield tag="005">20250103110447.0</controlfield><controlfield tag="006">m o d </controlfield><controlfield tag="007">cr \|\|\|\|\|\|\|\|\|\|\|</controlfield><controlfield tag="008">180412s2018 enk go 000 0 eng d</controlfield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">NLE</subfield><subfield code="b">eng</subfield><subfield code="e">pn</subfield><subfield code="c">NLE</subfield><subfield code="d">NLE</subfield><subfield code="d">EBLCP</subfield><subfield code="d">MERUC</subfield><subfield code="d">IDB</subfield><subfield code="d">CHVBK</subfield><subfield code="d">OCLCO</subfield><subfield code="d">OCLCF</subfield><subfield code="d">VT2</subfield><subfield code="d">OCLCQ</subfield><subfield code="d">OCLCO</subfield><subfield code="d">TEFOD</subfield><subfield code="d">OCLCQ</subfield><subfield code="d">N$T</subfield><subfield code="d">LVT</subfield><subfield code="d">C6I</subfield><subfield code="d">UKAHL</subfield><subfield code="d">OCLCQ</subfield><subfield code="d">OCLCO</subfield><subfield code="d">UKMGB</subfield><subfield code="d">OCLCO</subfield><subfield code="d">OCLCQ</subfield><subfield code="d">OCLCO</subfield><subfield code="d">OCLCL</subfield><subfield code="d">TMA</subfield><subfield code="d">OCLCQ</subfield><subfield code="d">CLOUD</subfield></datafield><datafield tag="015" ind1=" " ind2=" "><subfield code="a">GBC200204</subfield><subfield code="2">bnb</subfield></datafield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">018835881</subfield><subfield code="2">Uk</subfield></datafield><datafield tag="019" ind1=" " ind2=" "><subfield code="a">1031344421</subfield><subfield code="a">1295106151</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9781787128811</subfield><subfield code="q">(electronic bk.)</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">1787128814</subfield><subfield code="q">(electronic bk.)</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">178712276X</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9781787122765</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="z">178712276X</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="z">9781787122765</subfield></datafield><datafield tag="024" ind1="3" ind2=" "><subfield code="a">9781787122765</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)1032152617</subfield><subfield code="z">(OCoLC)1031344421</subfield><subfield code="z">(OCoLC)1295106151</subfield></datafield><datafield tag="037" ind1=" " ind2=" "><subfield code="a">9781787128811</subfield><subfield code="b">Packt Publishing</subfield></datafield><datafield tag="037" ind1=" " ind2=" "><subfield code="a">D508DE65-BBBA-46CD-928A-49C8DFBFE6AC</subfield><subfield code="b">OverDrive, Inc.</subfield><subfield code="n">http://www.overdrive.com</subfield></datafield><datafield tag="050" ind1=" " ind2="4"><subfield code="a">QA76.9.D5</subfield><subfield code="b">.K863 2018eb</subfield></datafield><datafield tag="072" ind1=" " ind2="7"><subfield code="a">COM</subfield><subfield code="x">013000</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="072" ind1=" " ind2="7"><subfield code="a">COM</subfield><subfield code="x">014000</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="072" ind1=" " ind2="7"><subfield code="a">COM</subfield><subfield code="x">018000</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="072" ind1=" " ind2="7"><subfield code="a">COM</subfield><subfield code="x">067000</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="072" ind1=" " ind2="7"><subfield code="a">COM</subfield><subfield code="x">032000</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="072" ind1=" " ind2="7"><subfield code="a">COM</subfield><subfield code="x">037000</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="072" ind1=" " ind2="7"><subfield code="a">COM</subfield><subfield code="x">052000</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="082" ind1="7" ind2=" "><subfield code="a">004.36</subfield><subfield code="2">23</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">MAIN</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Kumar, V. Naresh,</subfield><subfield code="e">author.</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Modern Big Data Processing with Hadoop :</subfield><subfield code="b">Expert techniques for architecting end-to-end big data solutions to get valuable insights /</subfield><subfield code="c">V Naresh Kumar, Prashant Shindgikar.</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Birmingham :</subfield><subfield code="b">Packt Publishing,</subfield><subfield code="c">2018.</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">1 online resource (394 pages)</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="a">text</subfield><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="a">computer</subfield><subfield code="b">c</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="a">online resource</subfield><subfield code="b">cr</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Table of ContentsHadoop Design Consideration Hadoop Life Cycle ManagementData Modeling in HadoopDesigning Streaming Data PipelinesBuilding Enterprise Search Platform Data Movement TechniquesEnterprise Data Architecture PrinciplesArchitecting Large Scale Data Processing Solutions using Spark Developing Application using Cloud InfrastructureDesigning Data Visualization Solutions Production Hadoop Administration and Cluster Deployment.</subfield></datafield><datafield tag="505" ind1="0" ind2=" "><subfield code="a">Cover; Title Page; Copyright and Credits; Packt Upsell; Contributors; Table of Contents; Preface; Chapter 1: Enterprise Data Architecture Principles; Data architecture principles; Volume; Velocity; Variety; Veracity; The importance of metadata; Data governance; Fundamentals of data governance; Data security; Application security; Input data; Big data security; RDBMS security; BI security; Physical security; Data encryption; Secure key management; Data as a Service; Evolution data architecture with Hadoop; Hierarchical database architecture; Network database architecture.</subfield></datafield><datafield tag="505" ind1="8" ind2=" "><subfield code="a">Relational database architectureEmployees; Devices; Department; Department and employee mapping table; Hadoop data architecture; Data layer; Data management layer; Job execution layer; Summary; Chapter 2: Hadoop Life Cycle Management; Data wrangling; Data acquisition; Data structure analysis; Information extraction; Unwanted data removal; Data transformation; Data standardization; Data masking; Substitution; Static ; Dynamic; Encryption; Hashing; Hiding; Erasing; Truncation; Variance; Shuffling; Data security; What is Apache Ranger?; Apache Ranger installation using Ambari; Ambari admin UI.</subfield></datafield><datafield tag="505" ind1="8" ind2=" "><subfield code="a">Add serviceService placement; Service client placement; Database creation on master; Ranger database configuration; Configuration changes; Configuration review; Deployment progress; Application restart; Apache Ranger user guide; Login to UI; Access manager; Service details; Policy definition and auditing for HDFS; Summary; Chapter 3: Hadoop Design Consideration; Understanding data structure principles; Installing Hadoop cluster; Configuring Hadoop on NameNode; Format NameNode; Start all services; Exploring HDFS architecture; Defining NameNode; Secondary NameNode; NameNode safe mode; DataNode.</subfield></datafield><datafield tag="505" ind1="8" ind2=" "><subfield code="a">Data replicationRack awareness; HDFS WebUI; Introducing YARN; YARN architecture; Resource manager; Node manager; Configuration of YARN; Configuring HDFS high availability; During Hadoop 1.x; During Hadoop 2.x and onwards; HDFS HA cluster using NFS; Important architecture points; Configuration of HA NameNodes with shared storage; HDFS HA cluster using the quorum journal manager; Important architecture points; Configuration of HA NameNodes with QJM; Automatic failover; Important architecture points; Configuring automatic failover; Hadoop cluster composition; Typical Hadoop cluster.</subfield></datafield><datafield tag="505" ind1="8" ind2=" "><subfield code="a">Best practices Hadoop deploymentHadoop file formats; Text/CSV file; JSON; Sequence file; Avro; Parquet; ORC; Which file format is better?; Summary; Chapter 4: Data Movement Techniques; Batch processing versus real-time processing; Batch processing; Real-time processing; Apache Sqoop; Sqoop Import; Import into HDFS; Import a MySQL table into an HBase table; Sqoop export; Flume; Apache Flume architecture; Data flow using Flume; Flume complex data flow architecture; Flume setup; Log aggregation use case; Apache NiFi; Main concepts of Apache NiFi; Apache NiFi architecture; Key features.</subfield></datafield><datafield tag="520" ind1=" " ind2=" "><subfield code="a">This book presents unique techniques to conquer different Big Data processing and analytics challenges using Hadoop. Practical examples are provided to boost your understanding of Big Data concepts and their implementation. By the end of the book, you will have all the knowledge and skills you need to become a true Big Data expert.</subfield></datafield><datafield tag="504" ind1=" " ind2=" "><subfield code="a">Includes bibliographical references.</subfield></datafield><datafield tag="630" ind1="0" ind2="0"><subfield code="a">Apache Hadoop.</subfield><subfield code="0">http://id.loc.gov/authorities/names/n2013024279</subfield></datafield><datafield tag="630" ind1="0" ind2="7"><subfield code="a">Apache Hadoop</subfield><subfield code="2">fast</subfield></datafield><datafield tag="650" ind1=" " ind2="0"><subfield code="a">Electronic data processing</subfield><subfield code="x">Distributed processing.</subfield><subfield code="0">http://id.loc.gov/authorities/subjects/sh85042293</subfield></datafield><datafield tag="650" ind1=" " ind2="6"><subfield code="a">Traitement réparti.</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Database design & theory.</subfield><subfield code="2">bicssc</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Data mining.</subfield><subfield code="2">bicssc</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Information architecture.</subfield><subfield code="2">bicssc</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Data capture & analysis.</subfield><subfield code="2">bicssc</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Computers</subfield><subfield code="x">Database Management</subfield><subfield code="x">Data Mining.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Computers</subfield><subfield code="x">Data Modeling & Design.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Computers</subfield><subfield code="x">Data Processing.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">COMPUTERS</subfield><subfield code="x">Computer Literacy.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">COMPUTERS</subfield><subfield code="x">Computer Science.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">COMPUTERS</subfield><subfield code="x">Hardware</subfield><subfield code="x">General.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">COMPUTERS</subfield><subfield code="x">Information Technology.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">COMPUTERS</subfield><subfield code="x">Machine Theory.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">COMPUTERS</subfield><subfield code="x">Reference.</subfield><subfield code="2">bisacsh</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Data Processing.</subfield><subfield code="2">bisacsh/2013</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">COMPUTERS.</subfield><subfield code="2">bisacsh/2013</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Data Mining.</subfield><subfield code="2">bisacsh/2013</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Databases.</subfield><subfield code="2">bisacsh/2013</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Data Modeling & Design.</subfield><subfield code="2">bisacsh/2013</subfield></datafield><datafield tag="650" ind1=" " ind2="7"><subfield code="a">Electronic data processing</subfield><subfield code="x">Distributed processing</subfield><subfield code="2">fast</subfield></datafield><datafield tag="655" ind1=" " ind2="0"><subfield code="a">Electronic books.</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Shindgikar, Prashant,</subfield><subfield code="e">author.</subfield></datafield><datafield tag="758" ind1=" " ind2=" "><subfield code="i">has work:</subfield><subfield code="a">Modern big data processing with Hadoop (Text)</subfield><subfield code="1">https://id.oclc.org/worldcat/entity/E39PCYVtfqwyTgQvFtBVQWhbVC</subfield><subfield code="4">https://id.oclc.org/worldcat/ontology/hasWork</subfield></datafield><datafield tag="776" ind1="0" ind2="8"><subfield code="i">Print version:</subfield><subfield code="a">Kumar, V Naresh.</subfield><subfield code="t">Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights.</subfield><subfield code="d">Birmingham : Packt Publishing, ©2018</subfield></datafield><datafield tag="966" ind1="4" ind2="0"><subfield code="l">DE-862</subfield><subfield code="p">ZDB-4-EBA</subfield><subfield code="q">FWS_PDA_EBA</subfield><subfield code="u">https://search.ebscohost.com/login.aspx?direct=true&scope=site&db=nlebk&AN=1789468</subfield><subfield code="3">Volltext</subfield></datafield><datafield tag="966" ind1="4" ind2="0"><subfield code="l">DE-863</subfield><subfield code="p">ZDB-4-EBA</subfield><subfield code="q">FWS_PDA_EBA</subfield><subfield code="u">https://search.ebscohost.com/login.aspx?direct=true&scope=site&db=nlebk&AN=1789468</subfield><subfield code="3">Volltext</subfield></datafield><datafield tag="884" ind1=" " ind2=" "><subfield code="a">LDL ebooks ONIX to marcxml transformation using Record_Load-eBooks_Legal_Deposit_onix2marc_v2-1.xsl</subfield><subfield code="g">20180412</subfield><subfield code="k">9781787128811</subfield><subfield code="q">Uk.</subfield></datafield><datafield tag="936" ind1=" " ind2=" "><subfield code="a">BATCHLOAD</subfield></datafield><datafield tag="938" ind1=" " ind2=" "><subfield code="a">cloudLibrary</subfield><subfield code="b">CLDL</subfield><subfield code="n">9781787128811</subfield></datafield><datafield tag="938" ind1=" " ind2=" "><subfield code="a">Askews and Holts Library Services</subfield><subfield code="b">ASKH</subfield><subfield code="n">AH34229802</subfield></datafield><datafield tag="938" ind1=" " ind2=" "><subfield code="a">EBL - Ebook Library</subfield><subfield code="b">EBLB</subfield><subfield code="n">EBL5340524</subfield></datafield><datafield tag="938" ind1=" " ind2=" "><subfield code="a">EBSCOhost</subfield><subfield code="b">EBSC</subfield><subfield code="n">1789468</subfield></datafield><datafield tag="994" ind1=" " ind2=" "><subfield code="a">92</subfield><subfield code="b">GEBAY</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">ZDB-4-EBA</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-862</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-863</subfield></datafield></record></collection>
genre	Electronic books.
genre_facet	Electronic books.
id	ZDB-4-EBA-on1032152617
illustrated	Not Illustrated
indexdate	2025-04-11T08:44:13Z
institution	BVB
isbn	9781787128811 1787128814 178712276X 9781787122765
language	English
oclc_num	1032152617
open_access_boolean
owner	MAIN DE-862 DE-BY-FWS DE-863 DE-BY-FWS
owner_facet	MAIN DE-862 DE-BY-FWS DE-863 DE-BY-FWS
physical	1 online resource (394 pages)
psigel	ZDB-4-EBA FWS_PDA_EBA ZDB-4-EBA
publishDate	2018
publishDateSearch	2018
publishDateSort	2018
publisher	Packt Publishing,
record_format	marc
spelling	Kumar, V. Naresh, author. Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights / V Naresh Kumar, Prashant Shindgikar. Birmingham : Packt Publishing, 2018. 1 online resource (394 pages) text txt rdacontent computer c rdamedia online resource cr rdacarrier Table of ContentsHadoop Design Consideration Hadoop Life Cycle ManagementData Modeling in HadoopDesigning Streaming Data PipelinesBuilding Enterprise Search Platform Data Movement TechniquesEnterprise Data Architecture PrinciplesArchitecting Large Scale Data Processing Solutions using Spark Developing Application using Cloud InfrastructureDesigning Data Visualization Solutions Production Hadoop Administration and Cluster Deployment. Cover; Title Page; Copyright and Credits; Packt Upsell; Contributors; Table of Contents; Preface; Chapter 1: Enterprise Data Architecture Principles; Data architecture principles; Volume; Velocity; Variety; Veracity; The importance of metadata; Data governance; Fundamentals of data governance; Data security; Application security; Input data; Big data security; RDBMS security; BI security; Physical security; Data encryption; Secure key management; Data as a Service; Evolution data architecture with Hadoop; Hierarchical database architecture; Network database architecture. Relational database architectureEmployees; Devices; Department; Department and employee mapping table; Hadoop data architecture; Data layer; Data management layer; Job execution layer; Summary; Chapter 2: Hadoop Life Cycle Management; Data wrangling; Data acquisition; Data structure analysis; Information extraction; Unwanted data removal; Data transformation; Data standardization; Data masking; Substitution; Static ; Dynamic; Encryption; Hashing; Hiding; Erasing; Truncation; Variance; Shuffling; Data security; What is Apache Ranger?; Apache Ranger installation using Ambari; Ambari admin UI. Add serviceService placement; Service client placement; Database creation on master; Ranger database configuration; Configuration changes; Configuration review; Deployment progress; Application restart; Apache Ranger user guide; Login to UI; Access manager; Service details; Policy definition and auditing for HDFS; Summary; Chapter 3: Hadoop Design Consideration; Understanding data structure principles; Installing Hadoop cluster; Configuring Hadoop on NameNode; Format NameNode; Start all services; Exploring HDFS architecture; Defining NameNode; Secondary NameNode; NameNode safe mode; DataNode. Data replicationRack awareness; HDFS WebUI; Introducing YARN; YARN architecture; Resource manager; Node manager; Configuration of YARN; Configuring HDFS high availability; During Hadoop 1.x; During Hadoop 2.x and onwards; HDFS HA cluster using NFS; Important architecture points; Configuration of HA NameNodes with shared storage; HDFS HA cluster using the quorum journal manager; Important architecture points; Configuration of HA NameNodes with QJM; Automatic failover; Important architecture points; Configuring automatic failover; Hadoop cluster composition; Typical Hadoop cluster. Best practices Hadoop deploymentHadoop file formats; Text/CSV file; JSON; Sequence file; Avro; Parquet; ORC; Which file format is better?; Summary; Chapter 4: Data Movement Techniques; Batch processing versus real-time processing; Batch processing; Real-time processing; Apache Sqoop; Sqoop Import; Import into HDFS; Import a MySQL table into an HBase table; Sqoop export; Flume; Apache Flume architecture; Data flow using Flume; Flume complex data flow architecture; Flume setup; Log aggregation use case; Apache NiFi; Main concepts of Apache NiFi; Apache NiFi architecture; Key features. This book presents unique techniques to conquer different Big Data processing and analytics challenges using Hadoop. Practical examples are provided to boost your understanding of Big Data concepts and their implementation. By the end of the book, you will have all the knowledge and skills you need to become a true Big Data expert. Includes bibliographical references. Apache Hadoop. http://id.loc.gov/authorities/names/n2013024279 Apache Hadoop fast Electronic data processing Distributed processing. http://id.loc.gov/authorities/subjects/sh85042293 Traitement réparti. Database design & theory. bicssc Data mining. bicssc Information architecture. bicssc Data capture & analysis. bicssc Computers Database Management Data Mining. bisacsh Computers Data Modeling & Design. bisacsh Computers Data Processing. bisacsh COMPUTERS Computer Literacy. bisacsh COMPUTERS Computer Science. bisacsh COMPUTERS Hardware General. bisacsh COMPUTERS Information Technology. bisacsh COMPUTERS Machine Theory. bisacsh COMPUTERS Reference. bisacsh Data Processing. bisacsh/2013 COMPUTERS. bisacsh/2013 Data Mining. bisacsh/2013 Databases. bisacsh/2013 Data Modeling & Design. bisacsh/2013 Electronic data processing Distributed processing fast Electronic books. Shindgikar, Prashant, author. has work: Modern big data processing with Hadoop (Text) https://id.oclc.org/worldcat/entity/E39PCYVtfqwyTgQvFtBVQWhbVC https://id.oclc.org/worldcat/ontology/hasWork Print version: Kumar, V Naresh. Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights. Birmingham : Packt Publishing, ©2018 LDL ebooks ONIX to marcxml transformation using Record_Load-eBooks_Legal_Deposit_onix2marc_v2-1.xsl 20180412 9781787128811 Uk.
spellingShingle	Kumar, V. Naresh Shindgikar, Prashant Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights / Cover; Title Page; Copyright and Credits; Packt Upsell; Contributors; Table of Contents; Preface; Chapter 1: Enterprise Data Architecture Principles; Data architecture principles; Volume; Velocity; Variety; Veracity; The importance of metadata; Data governance; Fundamentals of data governance; Data security; Application security; Input data; Big data security; RDBMS security; BI security; Physical security; Data encryption; Secure key management; Data as a Service; Evolution data architecture with Hadoop; Hierarchical database architecture; Network database architecture. Relational database architectureEmployees; Devices; Department; Department and employee mapping table; Hadoop data architecture; Data layer; Data management layer; Job execution layer; Summary; Chapter 2: Hadoop Life Cycle Management; Data wrangling; Data acquisition; Data structure analysis; Information extraction; Unwanted data removal; Data transformation; Data standardization; Data masking; Substitution; Static ; Dynamic; Encryption; Hashing; Hiding; Erasing; Truncation; Variance; Shuffling; Data security; What is Apache Ranger?; Apache Ranger installation using Ambari; Ambari admin UI. Add serviceService placement; Service client placement; Database creation on master; Ranger database configuration; Configuration changes; Configuration review; Deployment progress; Application restart; Apache Ranger user guide; Login to UI; Access manager; Service details; Policy definition and auditing for HDFS; Summary; Chapter 3: Hadoop Design Consideration; Understanding data structure principles; Installing Hadoop cluster; Configuring Hadoop on NameNode; Format NameNode; Start all services; Exploring HDFS architecture; Defining NameNode; Secondary NameNode; NameNode safe mode; DataNode. Data replicationRack awareness; HDFS WebUI; Introducing YARN; YARN architecture; Resource manager; Node manager; Configuration of YARN; Configuring HDFS high availability; During Hadoop 1.x; During Hadoop 2.x and onwards; HDFS HA cluster using NFS; Important architecture points; Configuration of HA NameNodes with shared storage; HDFS HA cluster using the quorum journal manager; Important architecture points; Configuration of HA NameNodes with QJM; Automatic failover; Important architecture points; Configuring automatic failover; Hadoop cluster composition; Typical Hadoop cluster. Best practices Hadoop deploymentHadoop file formats; Text/CSV file; JSON; Sequence file; Avro; Parquet; ORC; Which file format is better?; Summary; Chapter 4: Data Movement Techniques; Batch processing versus real-time processing; Batch processing; Real-time processing; Apache Sqoop; Sqoop Import; Import into HDFS; Import a MySQL table into an HBase table; Sqoop export; Flume; Apache Flume architecture; Data flow using Flume; Flume complex data flow architecture; Flume setup; Log aggregation use case; Apache NiFi; Main concepts of Apache NiFi; Apache NiFi architecture; Key features. Apache Hadoop. http://id.loc.gov/authorities/names/n2013024279 Apache Hadoop fast Electronic data processing Distributed processing. http://id.loc.gov/authorities/subjects/sh85042293 Traitement réparti. Database design & theory. bicssc Data mining. bicssc Information architecture. bicssc Data capture & analysis. bicssc Computers Database Management Data Mining. bisacsh Computers Data Modeling & Design. bisacsh Computers Data Processing. bisacsh COMPUTERS Computer Literacy. bisacsh COMPUTERS Computer Science. bisacsh COMPUTERS Hardware General. bisacsh COMPUTERS Information Technology. bisacsh COMPUTERS Machine Theory. bisacsh COMPUTERS Reference. bisacsh Data Processing. bisacsh/2013 COMPUTERS. bisacsh/2013 Data Mining. bisacsh/2013 Databases. bisacsh/2013 Data Modeling & Design. bisacsh/2013 Electronic data processing Distributed processing fast
subject_GND	http://id.loc.gov/authorities/names/n2013024279 http://id.loc.gov/authorities/subjects/sh85042293
title	Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights /
title_auth	Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights /
title_exact_search	Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights /
title_full	Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights / V Naresh Kumar, Prashant Shindgikar.
title_fullStr	Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights / V Naresh Kumar, Prashant Shindgikar.
title_full_unstemmed	Modern Big Data Processing with Hadoop : Expert techniques for architecting end-to-end big data solutions to get valuable insights / V Naresh Kumar, Prashant Shindgikar.
title_short	Modern Big Data Processing with Hadoop :
title_sort	modern big data processing with hadoop expert techniques for architecting end to end big data solutions to get valuable insights
title_sub	Expert techniques for architecting end-to-end big data solutions to get valuable insights /
topic	Apache Hadoop. http://id.loc.gov/authorities/names/n2013024279 Apache Hadoop fast Electronic data processing Distributed processing. http://id.loc.gov/authorities/subjects/sh85042293 Traitement réparti. Database design & theory. bicssc Data mining. bicssc Information architecture. bicssc Data capture & analysis. bicssc Computers Database Management Data Mining. bisacsh Computers Data Modeling & Design. bisacsh Computers Data Processing. bisacsh COMPUTERS Computer Literacy. bisacsh COMPUTERS Computer Science. bisacsh COMPUTERS Hardware General. bisacsh COMPUTERS Information Technology. bisacsh COMPUTERS Machine Theory. bisacsh COMPUTERS Reference. bisacsh Data Processing. bisacsh/2013 COMPUTERS. bisacsh/2013 Data Mining. bisacsh/2013 Databases. bisacsh/2013 Data Modeling & Design. bisacsh/2013 Electronic data processing Distributed processing fast
topic_facet	Apache Hadoop. Apache Hadoop Electronic data processing Distributed processing. Traitement réparti. Database design & theory. Data mining. Information architecture. Data capture & analysis. Computers Database Management Data Mining. Computers Data Modeling & Design. Computers Data Processing. COMPUTERS Computer Literacy. COMPUTERS Computer Science. COMPUTERS Hardware General. COMPUTERS Information Technology. COMPUTERS Machine Theory. COMPUTERS Reference. Data Processing. COMPUTERS. Data Mining. Databases. Data Modeling & Design. Electronic data processing Distributed processing Electronic books.
work_keys_str_mv	AT kumarvnaresh modernbigdataprocessingwithhadoopexperttechniquesforarchitectingendtoendbigdatasolutionstogetvaluableinsights AT shindgikarprashant modernbigdataprocessingwithhadoopexperttechniquesforarchitectingendtoendbigdatasolutionstogetvaluableinsights

Verfügbarkeit

Es ist kein Print-Exemplar vorhanden.

Volltext öffnen

MARC

Datensatz im Suchindex

Es ist kein Print-Exemplar vorhanden.

Ähnliche Einträge