Sample 3300008589

3300008589: Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 765640925 reassembly

Overview

Basic Information
IMG/M Taxon OID	3300008589 Open in IMG/M
GOLD Reference (Study \| Sequencing Project \| Analysis Project)	Gs0063646 \| Gp0052956 \| Ga0111083
Sample Name	Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 765640925 reassembly
Sequencing Status	Permanent Draft
Sequencing Center	Baylor College of Medicine, J. Craig Venter Institute (JCVI), Washington University in St. Louis
Published?	N
Use Policy	Open

Dataset Contents
Total Genome Size	106628167
Sequencing Scaffolds	23
Novel Protein Genes	26
Associated Families	21

Dataset Phylogeny
Taxonomy Groups	Number of Scaffolds
All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Negativicutes → Veillonellales → Veillonellaceae → Veillonella → Veillonella tobetsuensis	1
All Organisms → cellular organisms → Bacteria	1
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	2
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → Candidatus Saccharimonas aalborgensis	1
All Organisms → Viruses → Predicted Viral	7
All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ct6uZ8	1
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	3
All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → unclassified Candidatus Saccharimonas → Candidatus Saccharimonas sp.	1
Not Available	6

Ecosystem and Geography

Ecosystem Assignment (GOLD)
Name	Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase
Type	Host-Associated
Taxonomy	Host-Associated → Human → Digestive System → Oral Cavity → Tongue Dorsum → Human → Human Microbial Communities From The National Institute Of Health, Usa, Hmp Production Phase

Alternative Ecosystem Assignments
Environment Ontology (ENVO)	Unclassified
Earth Microbiome Project Ontology (EMPO)	Host-associated → Animal → Animal surface

Location Information
Location	USA: Maryland: Natonal Institute of Health
Coordinates	Lat. (^o)	39.0042816	Long. (^o)	-77.1012173	Alt. (m)	N/A	Depth (m)	N/A
Location on Map

Zoom:	Powered by OpenStreetMap^©

Associated Families

Family	Category	Number of Sequences	3D Structure?
F032313	Metagenome	180	N
F033081	Metagenome	178	Y
F046433	Metagenome	151	N
F054110	Metagenome	140	N
F080166	Metagenome	115	N
F081455	Metagenome	114	N
F081510	Metagenome	114	N
F089057	Metagenome	109	N
F092229	Metagenome	107	N
F092232	Metagenome	107	N
F094007	Metagenome	106	N
F095629	Metagenome	105	N
F095630	Metagenome	105	N
F095631	Metagenome	105	N
F095633	Metagenome	105	N
F099452	Metagenome	103	N
F099453	Metagenome	103	N
F103433	Metagenome	101	N
F103435	Metagenome	101	N
F105378	Metagenome	100	N
F105379	Metagenome	100	N

Associated Scaffolds

Scaffold	Taxonomy	Length	IMG/M Link
Ga0111083_100077	All Organisms → cellular organisms → Bacteria → Terrabacteria group → Firmicutes → Negativicutes → Veillonellales → Veillonellaceae → Veillonella → Veillonella tobetsuensis	42192	Open in IMG/M
Ga0111083_100310	All Organisms → cellular organisms → Bacteria	21785	Open in IMG/M
Ga0111083_101971	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	6842	Open in IMG/M
Ga0111083_102859	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → Candidatus Saccharimonas aalborgensis	5196	Open in IMG/M
Ga0111083_103832	All Organisms → Viruses → Predicted Viral	4193	Open in IMG/M
Ga0111083_104125	All Organisms → Viruses → Predicted Viral	3951	Open in IMG/M
Ga0111083_105429	All Organisms → Viruses → Predicted Viral	3240	Open in IMG/M
Ga0111083_107904	All Organisms → Viruses → Predicted Viral	2398	Open in IMG/M
Ga0111083_109511	All Organisms → Viruses → Predicted Viral	2048	Open in IMG/M
Ga0111083_109916	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes → unclassified Caudoviricetes → Myoviridae sp. ct6uZ8	1976	Open in IMG/M
Ga0111083_109958	All Organisms → Viruses → Predicted Viral	1970	Open in IMG/M
Ga0111083_112758	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	1604	Open in IMG/M
Ga0111083_113666	All Organisms → Viruses → Predicted Viral	1519	Open in IMG/M
Ga0111083_116908	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	1264	Open in IMG/M
Ga0111083_116995	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria	1258	Open in IMG/M
Ga0111083_117443	All Organisms → cellular organisms → Bacteria → Bacteria incertae sedis → Bacteria candidate phyla → Candidatus Saccharibacteria → Candidatus Saccharimonas → unclassified Candidatus Saccharimonas → Candidatus Saccharimonas sp.	1229	Open in IMG/M
Ga0111083_121712	Not Available	1016	Open in IMG/M
Ga0111083_125368	Not Available	888	Open in IMG/M
Ga0111083_126924	All Organisms → Viruses → Duplodnaviria → Heunggongvirae → Uroviricota → Caudoviricetes	843	Open in IMG/M
Ga0111083_126932	Not Available	843	Open in IMG/M
Ga0111083_135441	Not Available	658	Open in IMG/M
Ga0111083_136030	Not Available	648	Open in IMG/M
Ga0111083_138110	Not Available	614	Open in IMG/M

Sequences

Scaffold ID	Protein ID	Family	Sequence
Ga0111083_100077	Ga0111083_10007741	F054110	VNYQPTIKKLLKALQMNGRRYVVDVRQSWSKYDKPCKIYIVSRMYNEEEYKLTFPHKYKKGKTFKEKQLYKKESEYSSTKQHEVLLFLVKTYKGGD*
Ga0111083_100310	Ga0111083_10031012	F103433	MKEWSKNKPGVVFFFVVWFILSISFIGNFFGTGLWNGWFDGFQKDSSAIVEKTAYCKNKYDYKGPLIAADSKDYNKIMMSQDCNPSQVKPYVSQYGLQARVIAGLSPNDTSKIPAYIKRVSIFLAVLTAFLLALVVQKIRALFGRITASVFVVMLAFSPWIAGYARNIYWIEPLLIAPFVISFVGYQYFKKSKKLWLFYIIESVDMFLKLLNGYEYVSTIAISVLVPIIFFELVHKNVKIINLWKQAVPVFAATVVAFFGAYWVNFISLTDYYGSSDKAASAINARASDRGISGIRSMRAYAVGNFKILRPETYNFINQIVNLDNMANNSGKTYKYIIVNVVNYLLLPAITLPVHINGMFGEFVQSILFWTILGYLIILSSRKIIGKKYSRPFLWSMNFSVIGAFCWLALMPGHALPHAHINGIIFYIPLLLFVYVLIGLWADYVVKRTVKYE*
Ga0111083_101971	Ga0111083_1019712	F105379	MVIHFPLSQSDIESLLSISKLLKCDKILYDRNYVNPIIGVGPEKSYFQTTSFMVDLSPHINNLLVNISDLKNLGKITQLEPSKENPEIAIHKPVVSVFNWDAEYVKACMNSLREYQIDDNIIARTDEFHNTDCYNELMAGSASTGASRISVGGYMIDIPKSAMPTLKSDHVVATVYKAPNKDFNVLRFKITKRNGIIVNQSMLFLPY*
Ga0111083_102859	Ga0111083_1028595	F094007	LKTAEVLDLARPNRAGVIDVVDSDGNVVPLDYLGEDFVPDANSYSDKDFTKRNRIIVEMCDLFGRIRRRAGFAECHRGRGDYDRARRIERNRGSDISEVGRLAISACEACPLKLDCELYGKLGGAVLSDVLDYKKVRTATSLTKAGKKRSGWNKGCIDNNA*
Ga0111083_103739	Ga0111083_1037394	F103435	MKFVFCTEPIYQYYRSYLYADDKDKLDKQLMIEYGDYKDYWDLKNQQDALPENIFVAELTSRDYPRNPWNYVSQLISKLTYQYLIDSPEFETIFSEVLFNQSEAEFYEFYKAIDRFYNGSEVFIIIGNDEYSDMVTQMMCNVIRRTYGIHPQIIYDMDDVYSIRDDIDFSPQGAQLAYLQRAAYYKLEAKKNFEPLQIWYPFDMNTYTNALE*
Ga0111083_103832	Ga0111083_1038321	F095631	MASDAVSVNKTLRSYQETVLNTVQNDTLLNANIYDIHQYIENIKKRYVDEDEITLSMGIFGYLGDVNSNALQNAVTMAAEYSNEAIPIKAKFEKNVISHALMLGINKIFAEPATMQAMFVFYEDELILNTVSDTFKFDRNIKIMVGDYEFHLPYDLIIKRIELPTGEYIYTGMYDTTQSNPIITRNSNDVDPYLKPTVRSKIDGRNVVMLLVDLRQYEYMTYHKTIITNNPLESKMLQFEFDNQLAGFDVDVKEYDQPTRKLKPVYNGLNTDGVSKYCNYTYIDSSTIRVMFDNASYLPTANTEVTVNLYTCQGANGNISYKDSIYFRVKSDKMNYDRLNLLVIPTSDSQYGIDKKSIADLKRLIPKEALARGSVTNSTDINNYFNTIDDDDNKLFFFKKMDNPLARLYYAFVLMDSPTNIIPTNTIPIEAIRRDFDNISDSNYILTAGNVIKYDGTTNASIAYQASEDELNAARKNEFLYMNPFMCIVNKKPLYVSYYMNIMDVNKLLEFTYVNQDSKVQFIATKMNWYRHYLTERDTYFGDISIMQNIQSDIGLVHKDDPYDPEKITGVDIKVLAVFYTDDKYQVPYRWAEAEFVNYDQGTYVMDYKFKLNTDNKIDKNIKLKINNVYEVGNATRLSPGYMANNMHMKIFVFAKDVFGYNAGLHKSDHIFTADFLEGYSLTNEYTVKYGIDFLYNYSDLIESHIKVKKQDNGQISYIIDRVPVISYDYVNTEERIQDFINNLEKKRIHILDCLDVLEDSFGIDIKFFNTYGPSKLFYVNDGVPLNRVNLSMTFKVKFLTTTDKYLSEYIKNDIRKYIEDKSRISDIHIPNIITYITQKYAENVTYFEFLDFNGYGPGYQHIYRKDESIVGRIPEFLNINTIGTENNALDINIIIA*
Ga0111083_104125	Ga0111083_1041256	F092232	MNTQAKFIADYNDKNRPKFNDKFFTKSDDDIIEDLKDVILSCERNKFYTIKVLGFEVIDDYTEVQTLLIGDETPSISIKDSDLKILKVTYHVACAKDEDTFDVLIAIPRVIDGAYIHLNGNDYFPLFQLVDGSTYNNTTAAAAKTQSITLKTNSNAVKMLRNFVDLNTTKEKILRMAMFSVYLFDHKVTLFEYYLARFGWYETLSKFNFEDIIKISDHDIDDPEYYTFAIANSHMKSPFYISAVKTFVDNDRILQSFIASFAKAISLYATKKTTLDQIYTTEFWVCKLGYNFVSSETSVFTKGNAIIESLENSYDIPTKKRLRLPDHIKEDIYSVLKWMACEFSSIRLKNNLDASTKRIRWSEYIAAMYIMLINVKLRRLPEKHDPNMEAYRIKQQLNTPPMALIAELQKSNLKGFRNMVNDRDSFLQLKYTIKGPSGPGESNSKNVARNVRAIDPSHLGIIDLNTSSASDPGVGGMLCPLNYGVYEWNSFTNEEEPNVWDENFSKMLNIYREEKGYTSAIMLAEDAGLELTDTRDPEAVAFDAHLLGQTIAKVARTRAFEKQLRPALINMEDSCSIYFEEV*
Ga0111083_105429	Ga0111083_1054291	F081455	METTNTENKNLFQQLARLGFDVNESLLELEKEYAPVEEIDMQNVDIIDAAEEAIQQPLANTDSSIAVNFSQMINKPEVEEVKTEVASVPDNGETKVNVFFPKNEHILSNYVDYDSFNKIKESNTETIVRAVRLLNYKMSDQNAAMKFGQFVSEFNSECDPNKRLRYELIRHQGREKDLVVRLSTVVNGTTKYYADIYPDLNKIDIDHHLISSARK*
Ga0111083_105429	Ga0111083_1054292	F080166	MEVTFNNTIKRINTEIKENFHTEYVVGANKLTTNLRYRYRMRLSPRGETVGVIIDWDNYDDLCTVIDEAIDICDPGNKTSPFKRMYSTAGDLLDIKCDSLKVRYLHLEDRFGDRLDLIPFVLIDDHNGTLTEAMKFRFNNDLIFDVPVSRLKGFRRFLMTYNPLLHAGAMARYMSMTPLLGTNRQNMMR*
Ga0111083_105429	Ga0111083_1054295	F099453	MLRRKDMNRFDVIELAQQTLTFVYNTFNGKVNTLDPYTRLSFVSGYLDTKTNIARTTPYGCIYVSLEAFADTVERQGFIDTDQIRNLALEIIIHELTHVDQLIDYKYIKFNNGYREEVELKCVKQSCQWILDNIQYIRSFGLVVIPEVYQARLANLTNEVYTPKYPMAIAMGKLEYMLGRKFREFSNNNIEIEYIDRLKTHYAFMVCENRSYINSVNLNDLGERLLNDKQYTVEYLEYGNSKLVIKITQGA*
Ga0111083_107904	Ga0111083_1079041	F081510	GAKTTYNTAKILGKKYAPIALVTTGLVGYGIAVYQGIKSGKKLEATKAKYEAKDAAGEEYTRLEVIKDVTKDVAVPVAIAVASTAAIGLGFAIQTNRLKAVSAALTAVTEEHARYRLQCKEVLDEETFKKIDTPMDQVTVEEDGKEAQSFVPKEGLMYGNWFKYSANYASDSPEYNEQWIRESIRVLEEKIARKGLLNFSDMLDQLGFDVPKAALPFGWTDTDGFYIEYDIMEVWNAEEQVHEPQIYVRWKCPRNLYATTNFRDLIPGRKELA*
Ga0111083_109511	Ga0111083_1095111	F092229	MNDYRFDHIPEVVLRNIRFIRENNIDIGTGDDVLECMMDINPIIRTKIYDDYEFAKDVAERRFGSTIGGLDMITLLQKCNTRPYNSILNNIYFRYFNSKLIDDLFELAQSPKILDLAIEYECEYYAINTAKTSIRRYNSDAYYNKFAADSNIVSSTRVLNNPQVNAVKSAEFTHELLMASRAEKFSPENVREIFIKYGLKPNPSRNLYNRINDNLNLFYYIEDYLDEYREEGKFIYGGKE
Ga0111083_109916	Ga0111083_1099163	F095629	MRELIICACLFGCFGVANAAAPVDQPKEVKVVHNDDSVALHKKIYKLEQRIERLEKLLAEKEGK*
Ga0111083_109958	Ga0111083_1099583	F092229	MNKEYRFNHIPEVVLRNIRFIRDNNIDIGTGDDVLECMMDINPVVRTKIYDDYEFAKDVAERRFGSTIEKLDLRTVLQKCITRPYNSILNNIYFRYFNSELIDDLFKLGQSPKVLDLAIEYECEYYTVNAAKTNIRRYNTDAYYNKFAADSNIISSHRSLHDPQVNAVKSAEFTYDLLMASRAEEFNPEIVREIFVKYGLKPNASRNLYNRINDNLNLFYYIEDYLEEYKEEGRFIYGTKEYKIIKELRSLPLMVVLTQLTRKNDSGYILNSNLELVKG*
Ga0111083_112758	Ga0111083_1127582	F095630	DNDGLIAHIYEHLLAQYVLKRLQDNEFFVLSDMILSAKTYGDTCFMDAELYSSEVKKTYDEVLREFDKLVIPEDDILRAAGECGIEMNRNIVEVDRSELSKKLREVQISPWRKQIDMAYRKAQDESSVNTLFRTSYIKYSKESDDLFRECVLEYSIDESHIQTPVDQALAAVVIQAVALNFLVMIREKHTVYDRGDQWSEASKSVGYRTFLGISKKDDSIVHQLKNEFMEYAQFLSASPFCDNLQAALVRCSHNYEQVLLGRDTLNSILGGCVVGGRGWLEMADNTLIRQILKAIEIDVYDI*
Ga0111083_113666	Ga0111083_1136662	F099452	MDKTYTELLQETLSKIYELKDLNNRDRGKALTIFIGERLNRELILSSMNVFNLYKDIINLDDVSLLAELRHTEWYKDWFTSDKRNSDLIDLSKFNFRVLERFEKEEYLRDAEHYDFEGVSEVDSYDLFDTLREDEDIELFKLAAENILINHGFFNNTDYNLYEIPDEYMSNQEVCLYMCLLNTDNLDFMDKKTFDSTLLYNIVKDRICGSVYFTIFDSLNEDTRTRAR*
Ga0111083_116908	Ga0111083_1169081	F046433	MIELPTSPNALSELSPVAPPKLLSQAQDASRDNLMVYVKADNYLGTETSDPSFMKSRYKTTEYEAINDFVQFIKMTECYLPDYMENCAKELIDELAFLGVPELNFAANALAKRLRHHLEVGNKPVYIDVGNSLSQYRAKNEMKSSQYILSLVLSKFPDDEFEEYEGRLKVYGGRGEIDKSSKILFLDDWIVSGDQVRERISVFEVDNDPEDHEASVLVMAASGDYLDNGISAYSQYGGTIYPVEAYYRLKNSPDAGGMSRVTGIHSSTDNTFGYEVDGIAYCAIERGILKGEGIDELSLPALANIVRPYRNGKNFDGLSRFRQLLEKE*
Ga0111083_116995	Ga0111083_1169952	F033081	MHTDITVVYRPKKGVMAWLFRRAMPQDTRPTFVWSRLVTEIENAGYFSRRKFSILAVGLIIMTIAMVKMLLFVPGLNQSVVSLLTRGLETFLPTRWATATAWTVGMAGVFLMGDLTNYTPSQKILHKIKATRYEVYNIILFLALLEEQAFRSGSEKWNWRERVRASVCFGLLHIMNIWYSFAAGIALSVTGFGFLLVYLWYYRKYRIQIIATAAAATVHALYNAIALSLIAVVLAIDIAKLL*
Ga0111083_117443	Ga0111083_1174431	F095633	MRNENFTEVGRREGLTESELRTMGALAVEATEKLRKTIVSKEAVLLGSVPFGSWDEFAKAVQEMAAHKMTAYSYEPIPVKINTKRLIAIAFLDDRGEMSVEENSVLEDAFIDLSRTRCVVDADRSHKSYKFTCPVLERYPDGELYPIRGVYAISVIDVNGSQEVDFNIIYGGLN*
Ga0111083_121712	Ga0111083_1217122	F105378	KKWIQISSDEVLDVNKNLSDLKDKEAAITNLGLYEKFISKEALESGFLPDVFTPDNIVTDSTHQFVTDEEKSKWNNKLNAPVPMQDHLENNQIGYDSTNSKFYIGLNNQNVLLGGSSCFDNIIVVNGFFSGNSQPTVIRNNKFNEAGQLITPVFVDVQCVEYTAGDLGEVSVSYTADAISIYNTGSFTGSFQCLIVYPLGSVNE*
Ga0111083_125368	Ga0111083_1253681	F081455	VLFKAKEKHIMETTNIQEINMKAAEKLGELFDYVFCGKKPNTEEKDIPPVEEIGAEKVDIIDVAEEAIQQPLQNKDASIAVNFSQMVNKPKEEVKTEVNSVPPEGETKVNVLFPKTEHILGNYVDYDSFIKIKESNTDKVVRAVRLLNYKMSDQNAAAAFAQFVSEFNPECDPNKRLRYELIRHQGREKDLVIRLSTVINGTTKYYADIYPDLNKIDLDHHLISSAKK*
Ga0111083_126924	Ga0111083_1269241	F054110	VLDVNYQPTIKKLLKALQMNGRRYVVDVRQSWSKFDKPCKVYIVNRMYTEEEYKLTFPHKYKKGKTFKQGQLYKKESEYSSTKQHEVLLFLVRT
Ga0111083_126932	Ga0111083_1269321	F054110	VNYQPTIKKLLKALQMNGRRYVVDVRQSWSKFDKPCKIYIVNRMYTEEEYKLTFPNKYKKGKTFKQGQLYKKESEYSSTKQHEVLLFLVRT
Ga0111083_135441	Ga0111083_1354411	F089057	NRKGDTSGSLKSLISDLNCVTDNDDVLLFLSSIPRETKYSLDDAFDIIVSDDTYSNIFRTSIVFLNIDLDYHRLLLNAIKSESYTIICMINKAIPTPDLFLAKNNYECLTIALDKSYAIFDKVLGMVVGQIKHTASSKEGRALGIFMTICILNKDIDKLASLCTGYLATCRSEYMVKDLMNKSAMDAFQYMSEEDIHTVVDDINSRTVLSRYLNKM*
Ga0111083_136030	Ga0111083_1360301	F089057	MTNIIPLIAKKYNRKGDTSGTLKSLVDDLVFIEDVDDSLLFITNIPRETKYSIEEVFNIISSNDKYSEVLSNVLSSLNIDLDYHKLLLNAIDSESYKIISLISDNIPTPDLFLSKNNYGCLTTALGKSYTIFDKVLGMVISQLLHTSSKEDKILSLFMTICIVNKDIDKLASLCTGYLAITKDEVLVKDLMNESATMAFQYMSEEDIHDAVDDIN
Ga0111083_138110	Ga0111083_1381101	F032313	DNDTPQEKPREQEKHEVPVPKPKPQFDEVGERIWYGQTPAMRLDSTDYGAGLTSVFGMRTSSIPKQRFDSLFKQTVWEIKDIRVVETDLSLAKKNPGIMGWVTTTEFTCRNGVIVLHRQGINVNHVDTVNYVYDEVGNEIVLEGTGIRWFVLRLNKNAVEFLQRGRTMWGPFDWYYGRNSGRSEVTLEAK*

Bioinformatics & Integrated Biology Lab
Institute for Fundamental Biomedical Research
Biomedical Sciences Research Center "Alexander Fleming"

NMPFamsDB

NMPFamsDB

NMPFamsDB

A database of Novel Metagenome Protein Families

A database of Novel Metagenome Protein Clusters

A database of Novel Metagenome Protein Clusters

3300008589: Human tongue dorsum microbial communities from NIH, USA - visit 1, subject 765640925 reassembly

Overview

Ecosystem and Geography

Associated Families

Associated Scaffolds

Sequences